Вычислите меры центральной тенденции

Блокноты MuPAD® будут демонтированы в будущем релизе. Используйте live скрипты MATLAB® вместо этого.

Live скрипты MATLAB поддерживают большую часть функциональности MuPAD, хотя существуют некоторые различия. Для получения дополнительной информации смотрите, Преобразуют Notebook MuPAD в Live скрипты MATLAB.

Меры центральной тенденции определяют местоположение распределения данных вдоль соответствующей шкалы. Существует несколько стандартных мер центральной тенденции. Знание свойств конкретной выборки данных (таких как источник данных демонстрационные и возможные выбросы и их значения) может помочь вам выбрать самую полезную меру центральной тенденции для той выборки данных. MuPAD® обеспечивает следующие функции для вычисления мер центральной тенденции:

  • stats::modal функция возвращает наиболее частое значение выборки данных и количество случаев того значения.

  • stats::mean функция вычисляет среднее арифметическое

    из выборки данных x 1, x 2, ..., x n.

  • stats::quadraticMean функция вычисляет квадратичное среднее

    из выборки данных x 1, x 2, ..., x n.

  • stats::median функция возвращает элемент x n отсортированной выборки данных x 1, x 2, ..., x 2n.

  • stats::geometricMean функция вычисляет среднее геометрическое

    из выборки данных x 1, x 2, ..., x n.

  • stats::harmonicMean функция вычисляет среднее гармоническое

    из выборки данных x 1, x 2, ..., x n.

Среднее арифметическое является простой и популярной мерой центральной тенденции. Это служит лучше всего для выборок данных, которые не имеют значительных выбросов. К сожалению, выбросы (например, ошибки ввода данных или незначительные сбои) существуют почти во всех действительных данных. Среднее арифметическое и квадратичное среднее чувствительны к этим проблемам. Одно значение неправильных данных может отодвинуть среднее значение от центра остальной части данных произвольно большим расстоянием. Например, создайте следующие два списка записей, которые содержат только один выброс. Выброс равен 100 в первом списке и 1 во втором списке:

L := [1, 1, 1, 1, 1, 100.0]:
S := [100, 100, 100, 100, 100, 1.0]:

stats::modal функция показывает, что самая частая запись первого списка равняется 1. Самая частая запись второго списка равняется 100. Самая частая запись появляется в каждом списке пять раз:

modalL = stats::modal(L);
modalS = stats::modal(S)

Если значение выброса является большим, выброс может значительно отодвинуть среднее значение и квадратичное среднее от центра:

meanL = stats::mean(L);
quadraticMeanL = stats::quadraticMean(L)

Большие выбросы влияют на среднее геометрическое и среднее гармоническое меньше, чем они влияют на простое среднее арифметическое. Тем не менее, и средние геометрические и средние гармонические являются также не абсолютно стойкими к выбросам:

geometricMeanL = stats::geometricMean(L);
harmonicMeanL = stats::harmonicMean(L)

Если значение выброса мало, удар на среднее значение набора данных менее примечателен. Квадратичное среднее может эффективно смягчить удар нескольких маленьких выбросов:

meanS = stats::mean(S);
quadraticMeanS = stats::quadraticMean(S)

Маленький выброс значительно влияет на средние геометрические и средние гармонические, вычисленные для списка S:

geometricMeanS = stats::geometricMean(S);
harmonicMeanS = stats::harmonicMean(S)

Медиана является обычно стойкой и к большим и к маленьким выбросам:

medianL = stats::median(L);
medianS = stats::median(S)

Для выборок данных, которые содержат четное число элементов, MuPAD может использовать два определения медианы. По умолчанию, stats::median возвращает n/2- элемент th отсортированной выборки данных:

z := [1, 1, 1, 100, 100, 100]:
medianZ = stats::median(z)

Когда вы используете Averaged опция, stats::median возвращает среднее арифметическое двух центральных элементов отсортированной выборки данных:

z := [1, 1, 1, 100, 100, 100]:
medianZ = stats::median(z, Averaged)

Тем не менее, медиана является не всегда лучшим выбором для измерения центральной тенденции выборки данных. Например, следующее демонстрационное распределение данных имеет шаг в середине:

z := [1, 1, 1, 2, 100, 100, 100]:
medianZ = stats::median(z)