exponenta event banner

Меры рассеивания

Целью измерения дисперсии является определение распределения значений данных в числовой строке. Еще одним термином для этих статистических данных являются показатели распространения.

В таблице приведены имена и описания функций.

Имя функции

Описание

iqr

Межквартильный ареал

mad

Среднее абсолютное отклонение

moment

Центральный момент всех заказов

range

Диапазон

std

Стандартное отклонение

var

Различие

Диапазон (разница между максимальным и минимальным значениями) является простейшей мерой разброса. Но если в данных есть отклонение, это будет минимальное или максимальное значение. Таким образом, диапазон не является устойчивым к отклонениям.

Стандартное отклонение и дисперсия являются популярными показателями разброса, оптимальными для нормально распределенных выборок. Дисперсия выборки - это безальтернативный оценщик минимальной дисперсии (MVUE) нормального параметра, Стандартное отклонение является квадратным корнем дисперсии и имеет желательное свойство находиться в тех же единицах, что и данные. То есть, если данные в метрах, стандартное отклонение также в метрах. Дисперсия находится в измерителях 2, что труднее интерпретировать.

Ни стандартное отклонение, ни отклонение не являются устойчивыми к отклонениям. Значение данных, которое отделено от тела данных, может увеличить значение статистики на произвольно большую величину.

Среднее абсолютное отклонение (MAD) также чувствительно к отклонениям. Но MAD движется не так сильно, как стандартное отклонение или дисперсия в ответ на плохие данные.

Межквартильный диапазон (IQR) представляет собой разницу между 75-м и 25-м процентилями данных. Поскольку только средние 50% данных влияют на эту меру, она устойчива к отклонениям.

Сравнение показателей дисперсии

В этом примере показано, как вычислять и сравнивать измерения дисперсии для выборочных данных, содержащих один выброс.

Создайте образец данных, содержащий одно значение отклонения.

x = [ones(1,6),100]
x = 1×7

     1     1     1     1     1     1   100

Вычислите межквартильный диапазон, среднее абсолютное отклонение, диапазон и стандартное отклонение данных выборки.

stats = [iqr(x),mad(x),range(x),std(x)]
stats = 1×4

         0   24.2449   99.0000   37.4185

Межквартильный диапазон (iqr) - разница между 75-м и 25-м процентилями данных выборки и устойчива к отклонениям. Диапазон (range) является разницей между максимальным и минимальным значениями в данных и сильно зависит от наличия отклонения.

Как среднее абсолютное отклонение (mad) и стандартное отклонение (std) чувствительны к отклонениям. Однако среднее абсолютное отклонение менее чувствительно, чем стандартное отклонение.

Связанные темы