Показатели центральной тенденции определяют распределение данных по соответствующим масштабам.
В следующей таблице перечислены функции, которые вычисляют показатели центральной тенденции.
Имя функции | Описание |
|---|---|
Среднее геометрическое | |
Среднее гармоническое | |
Среднее арифметическое | |
50-й процентиль | |
Наиболее частое значение | |
Обрезанное среднее |
Среднее - простая и популярная оценка местоположения. Если выборка данных происходит из нормального распределения, то среднее значение выборки также является оптимальным (безальтернативный оценщик минимальной дисперсии (MVUE), равный
К сожалению, отклонения, ошибки ввода данных или сбои существуют почти во всех реальных данных. Образец среднего чувствителен к этим проблемам. Одно плохое значение данных может отодвинуть среднее значение от центра остальных данных на произвольно большое расстояние.
Среднее и усеченное среднее - это две меры, которые устойчивы (устойчивы) к отклонениям. Медиана - это 50-й процентиль образца, который изменится лишь незначительно, если добавить большое возмущение к любому значению. Идея, лежащая в основе усеченного среднего, заключается в игнорировании небольшого процента самых высоких и самых низких значений образца при определении центра образца.
Среднее геометрическое и среднее гармоническое, как и среднее, не устойчивы к отклонениям. Они полезны, когда образец распределен логнормально или сильно скошен.
В этом примере показано, как вычислять и сравнивать измерения местоположения для выборочных данных, содержащих одно отклонение.
Создайте образец данных, содержащий одно отклонение.
x = [ones(1,6),100]
x = 1×7
1 1 1 1 1 1 100
Вычислите среднее геометрическое, среднее гармоническое, среднее, среднее и усеченное среднее для данных выборки.
locate = [geomean(x) harmmean(x) mean(x) median(x)... trimmean(x,25)]
locate = 1×5
1.9307 1.1647 15.1429 1.0000 1.0000
Среднее (mean) далеко от любого значения данных из-за влияния отклонения. Среднее геометрическое (geomean) и среднее гармоническое (harmmean) подвержены влиянию отклонений, но не так существенно. Медиана (median) и усеченное среднее (trimmean) игнорируют значение отклонения и описывают расположение остальных значений данных.