stats::winsorize

Зафиксируйте (winsorize) экстремальные значения

Блокноты MuPAD® будут демонтированы в будущем релизе. Используйте live скрипты MATLAB® вместо этого.

Live скрипты MATLAB поддерживают большую часть функциональности MuPAD, хотя существуют некоторые различия. Для получения дополнительной информации смотрите, Преобразуют Notebook MuPAD в Live скрипты MATLAB.

Синтаксис

stats::winsorize([x1, x2, …], α)
stats::winsorize([[x11, x12, …], [x21, x22, …], …], α, i)
stats::winsorize(s, α, i)

Описание

stats::winsorize([x1, x2, …], α) возвращает копию [x 1, x 2, …], в котором все записи, меньшие, чем квантиль α, заменяются этим значением и аналогично для всех записей, больше, чем 1 - квантиль α.

stats::winsorize([[x11, x12,...], [x21, x22,...],...], α, i) и stats::winsorize(stats::sample([[x11, x12,...], [x21, x22,...],...]), α, i) работает над i-th записи входных строк.

Данные об измерении часто содержат “выбросы”, точки выборки довольно далеко вне области значений, содержащей большинство точек. В то время как ожидается и из теории и из опыта, эти выбросы, для маленьких или выборок среднего размера, имеют тенденцию искажать статистические данные, такие как среднее значение.

Один из стандартных методов, имеющих дело с этой проблемой для (действительных) непрерывных шкал, фиксирует выбросы. stats::winsorize наборы все точки данных ниже или выше данного квантиля к этим квантилям. Эту операцию называют в честь ее изобретателя, Чарльза П. Винсора.

Примеры

Пример 1

Создайте нормально распределенную выборку, немного загрязненную:

r := stats::normalRandom(0, 1, Seed=2):
data := [r() $ i = 1..300, 100*r() $ i = 1..2]:

Эти два дополнительных очка значительно искажают данные:

plot(plot::Histogram2d(data, Cells=20))

Используя любой stats::winsorize удаляет этот шум, и изображение показывает больше детали:

plot(plot::Histogram2d(stats::winsorize(data, 1/100), Cells=20))

Оба stats::winsorize уменьшает стандартное отклонение выборки. При учете того факта, что стандартное отклонение генератора случайных чисел равняется 1, вычислите те из данных в его различных формах:

stats::stdev(data),
stats::stdev(stats::winsorize(data, 1/20))

Параметры

x1, x2, x11, …

Статистические данные: арифметические выражения. Данные, чтобы отфильтровать на должны быть с действительным знаком.

s

Выборка типа stats::sample

α

Параметр сокращения: выражение с действительным знаком.

i

Индекс столбца: положительное целое число. Вложенный список или выборка являются winsorized на своем i-th столбец.

Возвращаемые значения

Входные данные с выбросами, заменяемыми значениями квантилей.

Смотрите также

Функции MuPAD