stats
::swGOFT
Качество подгонки Шапиро-Вилка тестирует на нормальность
Блокноты MuPAD® будут демонтированы в будущем релизе. Используйте live скрипты MATLAB® вместо этого.
Live скрипты MATLAB поддерживают большую часть функциональности MuPAD, хотя существуют некоторые различия. Для получения дополнительной информации смотрите, Преобразуют Notebook MuPAD в Live скрипты MATLAB.
stats::swGOFT(x1, x2, …
) stats::swGOFT([x1, x2, …]
) stats::swGOFT(s
, <c
>)
stats::swGOFT
([x 1, x 2, …]), применяет тест качества подгонки Шапиро-Вилка для нулевой гипотезы: “данные x 1, x 2, … нормально распределен (с неизвестным средним значением и отклонением)”. Объем выборки не должен быть больше, чем 5 000 и не меньшим, чем 3.
Внешние статистические данные, сохраненные в ASCII-файле, могут быть импортированы в сеанс MuPAD® через import::readdata
. В частности, смотрите Пример 1 из соответствующей страницы справки.
Ошибка повышена stats::swGOFT
если какие-либо из данных не могут быть преобразованы в действительное число с плавающей запятой или если объем выборки является слишком большим или слишком маленьким.
Позвольте y 1, …, y n быть входными данными x 1, …, x n, расположенный в порядке возрастания. stats::swGOFT
возвращает список [PValue = p, StatValue = w]
содержа следующую информацию:
w
достигнутое значение статистической величины Шапиро-Вилка
.
Здесь, i a является коэффициентами Шапиро-Вилка и S^2
статистическое отклонение выборки.
p
наблюдаемый уровень значения статистической величины Шапиро-Вилка W.
Наблюдаемый уровень значения PValue = p
возвращенный stats::swGOFT
должен быть интерпретирован следующим образом: Если p
меньше, чем данный уровень значения α <<1, нулевая гипотеза может быть отклонена на уровне α. Если p
больше, чем α, нулевая гипотеза не должна быть отклонена на уровне α.
Функция чувствительна к переменной окружения DIGITS
который определяет числовую рабочую точность.
Мы тестируем список случайных данных, которые подразумевают быть выборкой нормально распределенных чисел:
f := stats::normalRandom(0, 1, Seed = 123): data := [f() $ i = 1..400]: stats::swGOFT(data)
Наблюдаемый уровень значения не мал. Следовательно, не нужно отклонять нулевую гипотезу, что данные нормально распределены.
Затем мы любим до безумия данные с некоторыми однородно непрерывными, отклоняется:
impuredata := data . [frandom() $ i = 1..101]: stats::swGOFT(impuredata)
Любившие до безумия данные могут быть отклонены как выборка нормальных отклонений на уровнях значения, столь же небольших как.
delete f, data, impuredata:
Мы создаем выборку, состоящую из одного столбца строки и двух столбцов нестроки:
s := stats::sample( [["1996", 1242, PI - 1/2], ["1997", 1353, PI + 0.3], ["1998", 1142, PI + 0.5], ["1999", 1201, PI - 1], ["2001", 1201, PI] ])
"1996" 1242 PI - 1/2 "1997" 1353 PI + 0.3 "1998" 1142 PI + 0.5 "1999" 1201 PI - 1 "2001" 1201 PI
Мы проверяем, нормально распределены ли данные третьего столбца:
stats::swGOFT(s, 3)
Наблюдаемый уровень значения, возвращенный тестом, не мал: тест не указывает, что данные не нормально распределены.
delete s:
|
Статистические данные: действительные численные значения |
|
Выборка доменного типа |
|
Целое число, представляющее индекс столбца демонстрационного |
Список двух уравнений [PValue = p, StatValue = w]
со значениями с плавающей точкой p
и w
. Смотрите раздел 'Details' ниже для интерпретации этих значений.
Реализованный алгоритм для расчета коэффициентов Шапиро-Вилка, статистической величины Шапиро-Вилка и наблюдаемого уровня значения на основе: Патрик Ройстон, “Алгоритм, КОГДА R94”, Прикладная статистика, Vol.44, № 4 (1995).
После Ройстона, коэффициенты Шапиро-Вилка a i вычисляются приближением
где M обозначает ожидаемые значения стандартной нормальной статистической величины порядка для выборки, V является соответствующей ковариационной матрицей и M, T является транспонированием M.