Вычислите меры центральной тенденции

Блокноты MuPAD® будут демонтированы в будущем релизе. Используйте live скрипты MATLAB® вместо этого.

Live скрипты MATLAB поддерживают большую часть функциональности MuPAD, хотя существуют некоторые различия. Для получения дополнительной информации смотрите, Преобразовывают Notebook MuPAD в Live скрипты MATLAB.

Меры центральной тенденции определяют местоположение распределения данных вдоль соответствующей шкалы. Существует несколько стандартных мер центральной тенденции. Знание свойств конкретной выборки данных (таких как источник данных демонстрационные и возможные выбросы и их значения) может помочь вам выбрать самую полезную меру центральной тенденции для той выборки данных. MuPAD® обеспечивает следующие функции для вычисления мер центральной тенденции:

  • Функция stats::modal возвращает наиболее частое значение выборки данных и количество случаев того значения.

  • Функция stats::mean вычисляет среднее арифметическое

    из выборки данных x 1, x 2, ..., x n.

  • Функция stats::quadraticMean вычисляет квадратичное среднее

    из выборки данных x 1, x 2, ..., x n.

  • Функция stats::median возвращает элемент x n отсортированной выборки данных x 1, x 2, ..., x 2n.

  • Функция stats::geometricMean вычисляет среднее геометрическое

    из выборки данных x 1, x 2, ..., x n.

  • Функция stats::harmonicMean вычисляет среднее гармоническое

    из выборки данных x 1, x 2, ..., x n.

Среднее арифметическое является простой и популярной мерой центральной тенденции. Это служит лучше всего для выборок данных, которые не имеют значительных выбросов. К сожалению, выбросы (например, ошибки ввода данных или незначительные сбои) существуют почти во всех действительных данных. Среднее арифметическое и квадратичное среднее чувствительны к этим проблемам. Одно значение неправильных данных может отодвинуть среднее значение от центра остальной части данных произвольно большим расстоянием. Например, создайте следующие два списка записей, которые содержат только один выброс. Выброс равен 100 в первом списке и 1 во втором списке:

L := [1, 1, 1, 1, 1, 100.0]:
S := [100, 100, 100, 100, 100, 1.0]:

Функция stats::modal показывает, что самая частая запись первого списка равняется 1. Самая частая запись второго списка равняется 100. Самая частая запись появляется в каждом списке пять раз:

modalL = stats::modal(L);
modalS = stats::modal(S)

Если значение выброса является большим, выброс может значительно отодвинуть среднее значение и квадратичное среднее от центра:

meanL = stats::mean(L);
quadraticMeanL = stats::quadraticMean(L)

Большие выбросы влияют на среднее геометрическое и среднее гармоническое меньше, чем они влияют на простое среднее арифметическое. Тем не менее, и средние геометрические и средние гармонические являются также не абсолютно стойкими к выбросам:

geometricMeanL = stats::geometricMean(L);
harmonicMeanL = stats::harmonicMean(L)

Если значение выброса является маленьким, влияние на среднее значение набора данных менее примечательно. Квадратичное среднее может эффективно смягчить влияние нескольких маленьких выбросов:

meanS = stats::mean(S);
quadraticMeanS = stats::quadraticMean(S)

Маленький выброс значительно влияет на средние геометрические и средние гармонические, вычисленные для списка S:

geometricMeanS = stats::geometricMean(S);
harmonicMeanS = stats::harmonicMean(S)

Медиана является обычно стойкой и к большим и к маленьким выбросам:

medianL = stats::median(L);
medianS = stats::median(S)

Для выборок данных, которые содержат четное число элементов, MuPAD может использовать два определения медианы. По умолчанию stats::median возвращает n/2-th элемент отсортированной выборки данных:

z := [1, 1, 1, 100, 100, 100]:
medianZ = stats::median(z)

Когда вы используете опцию Averaged, stats::median возвращает среднее арифметическое двух центральных элементов отсортированной выборки данных:

z := [1, 1, 1, 100, 100, 100]:
medianZ = stats::median(z, Averaged)

Тем не менее, медиана является не всегда лучшим выбором для измерения центральной тенденции выборки данных. Например, следующее демонстрационное распределение данных имеет шаг в середине:

z := [1, 1, 1, 2, 100, 100, 100]:
medianZ = stats::median(z)

Для просмотра документации необходимо авторизоваться на сайте