exponenta event banner

Показатели центральной тенденции

Показатели центральной тенденции определяют распределение данных по соответствующим масштабам.

В следующей таблице перечислены функции, которые вычисляют показатели центральной тенденции.

Имя функции

Описание

geomean

Среднее геометрическое

harmmean

Среднее гармоническое

mean

Среднее арифметическое

median

50-й процентиль

mode

Наиболее частое значение

trimmean

Обрезанное среднее

Среднее - простая и популярная оценка местоположения. Если выборка данных происходит из нормального распределения, то среднее значение выборки также является оптимальным (безальтернативный оценщик минимальной дисперсии (MVUE), равный

К сожалению, отклонения, ошибки ввода данных или сбои существуют почти во всех реальных данных. Образец среднего чувствителен к этим проблемам. Одно плохое значение данных может отодвинуть среднее значение от центра остальных данных на произвольно большое расстояние.

Среднее и усеченное среднее - это две меры, которые устойчивы (устойчивы) к отклонениям. Медиана - это 50-й процентиль образца, который изменится лишь незначительно, если добавить большое возмущение к любому значению. Идея, лежащая в основе усеченного среднего, заключается в игнорировании небольшого процента самых высоких и самых низких значений образца при определении центра образца.

Среднее геометрическое и среднее гармоническое, как и среднее, не устойчивы к отклонениям. Они полезны, когда образец распределен логнормально или сильно скошен.

Показатели центральной тенденции

В этом примере показано, как вычислять и сравнивать измерения местоположения для выборочных данных, содержащих одно отклонение.

Создайте образец данных, содержащий одно отклонение.

x = [ones(1,6),100]
x = 1×7

     1     1     1     1     1     1   100

Вычислите среднее геометрическое, среднее гармоническое, среднее, среднее и усеченное среднее для данных выборки.

locate = [geomean(x) harmmean(x) mean(x) median(x)... 
          trimmean(x,25)]
locate = 1×5

    1.9307    1.1647   15.1429    1.0000    1.0000

Среднее (mean) далеко от любого значения данных из-за влияния отклонения. Среднее геометрическое (geomean) и среднее гармоническое (harmmean) подвержены влиянию отклонений, но не так существенно. Медиана (median) и усеченное среднее (trimmean) игнорируют значение отклонения и описывают расположение остальных значений данных.

Связанные темы