Целью измерения дисперсии является определение распределения значений данных в числовой строке. Еще одним термином для этих статистических данных являются показатели распространения.
В таблице приведены имена и описания функций.
Имя функции | Описание |
|---|---|
iqr | Межквартильный ареал |
mad | Среднее абсолютное отклонение |
moment | Центральный момент всех заказов |
range | Диапазон |
std | Стандартное отклонение |
var | Различие |
Диапазон (разница между максимальным и минимальным значениями) является простейшей мерой разброса. Но если в данных есть отклонение, это будет минимальное или максимальное значение. Таким образом, диапазон не является устойчивым к отклонениям.
Стандартное отклонение и дисперсия являются популярными показателями разброса, оптимальными для нормально распределенных выборок. Дисперсия выборки - это безальтернативный оценщик минимальной дисперсии (MVUE) нормального параметра, Стандартное отклонение является квадратным корнем дисперсии и имеет желательное свойство находиться в тех же единицах, что и данные. То есть, если данные в метрах, стандартное отклонение также в метрах. Дисперсия находится в измерителях 2, что труднее интерпретировать.
Ни стандартное отклонение, ни отклонение не являются устойчивыми к отклонениям. Значение данных, которое отделено от тела данных, может увеличить значение статистики на произвольно большую величину.
Среднее абсолютное отклонение (MAD) также чувствительно к отклонениям. Но MAD движется не так сильно, как стандартное отклонение или дисперсия в ответ на плохие данные.
Межквартильный диапазон (IQR) представляет собой разницу между 75-м и 25-м процентилями данных. Поскольку только средние 50% данных влияют на эту меру, она устойчива к отклонениям.
В этом примере показано, как вычислять и сравнивать измерения дисперсии для выборочных данных, содержащих один выброс.
Создайте образец данных, содержащий одно значение отклонения.
x = [ones(1,6),100]
x = 1×7
1 1 1 1 1 1 100
Вычислите межквартильный диапазон, среднее абсолютное отклонение, диапазон и стандартное отклонение данных выборки.
stats = [iqr(x),mad(x),range(x),std(x)]
stats = 1×4
0 24.2449 99.0000 37.4185
Межквартильный диапазон (iqr) - разница между 75-м и 25-м процентилями данных выборки и устойчива к отклонениям. Диапазон (range) является разницей между максимальным и минимальным значениями в данных и сильно зависит от наличия отклонения.
Как среднее абсолютное отклонение (mad) и стандартное отклонение (std) чувствительны к отклонениям. Однако среднее абсолютное отклонение менее чувствительно, чем стандартное отклонение.