exponenta event banner

lillietest

Тест Лиллиефорса

Описание

пример

h = lillietest(x) возвращает тестовое решение для нулевой гипотезы, что данные в векторе x происходит из распределения в нормальном семействе, против альтернативы, что оно не происходит из такого распределения, используя тест Лиллиефорса. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне значимости 5%, и 0 в противном случае.

пример

h = lillietest(x,Name,Value) возвращает тестовое решение с дополнительными параметрами, заданными одним или несколькими аргументами пары имя-значение. Например, можно протестировать данные для другого семейства распределения, изменить уровень значимости или вычислить значение p с помощью аппроксимации Монте-Карло.

пример

[h,p] = lillietest(___) также возвращает значение p p, используя любой из входных аргументов из предыдущих синтаксисов.

пример

[h,p,kstat,critval] = lillietest(___) также возвращает статистику теста kstat и критическое значение critval для теста.

Примеры

свернуть все

Загрузите образцы данных. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует нормальному распределению по различным типам автомобилей.

load carbig
[h,p,k,c] = lillietest(MPG)
Warning: P is less than the smallest tabulated value, returning 0.001.
h = 1
p = 1.0000e-03
k = 0.0789
c = 0.0451

Статистика теста k больше критического значения c, так lillietest возвращает результат h = 1 для указания отклонения нулевой гипотезы на уровне значимости по умолчанию 5%. Предупреждение указывает, что возвращаемое значение p меньше наименьшего значения в таблице предварительно вычисленных значений. Чтобы найти более точное значение p, используйте MCTol чтобы выполнить приближение Монте-Карло. См. раздел Определение значения p с помощью аппроксимации Монте-Карло.

Загрузите образцы данных. Создайте вектор, содержащий первый столбец данных оценок ЕГЭ учащихся.

load examgrades
x = grades(:,1);

Проверьте нулевую гипотезу о том, что данные выборки получены из нормального распределения на уровне значимости 1%.

[h,p] = lillietest(x,'Alpha',0.01)
h = 0
p = 0.0348

Возвращенное значение h = 0 указывает, что lillietest не отвергает нулевую гипотезу на уровне значимости 1%.

Загрузите образцы данных. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует экспоненциальное распределение по различным типам автомобилей.

load carbig
h = lillietest(MPG,'Distribution','exponential')
h = 1

Возвращенное значение h = 1 указывает, что lillietest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Создайте два набора данных выборки, один из распределения Вейбулла и другой из логнормального распределения. Выполните тест Lilliefors для оценки того, является ли каждый набор данных из распределения Вейбулла. Подтвердите решение теста, проведя визуальное сравнение с использованием графика вероятностей Вейбулла (wblplot).

Создание выборок из распределения Вейбулла.

rng('default')
data1 = wblrnd(0.5,2,[500,1]);

Выполните тест Lilliefors с помощью lillietest. Чтобы проверить данные для распределения Вейбулла, проверьте, имеет ли логарифм данных крайнее распределение значений.

h1 = lillietest(log(data1),'Distribution','extreme value')
h1 = 0

Возвращенное значение h1 = 0 указывает, что lillietest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%. Подтвердите решение теста, используя график вероятностей Вейбулла.

wblplot(data1)

Figure contains an axes. The axes with title Weibull Probability Plot contains 3 objects of type line.

График показывает, что данные следуют распределению Вейбулла.

Создание образцов из логнормального распределения.

data2 =lognrnd(5,2,[500,1]);

Выполните тест Lilliefors.

h2 = lillietest(log(data2),'Distribution','extreme value')
h2 = 1

Возвращенное значение h2 = 1 указывает, что lillietest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%. Подтвердите решение теста, используя график вероятностей Вейбулла.

wblplot(data2)

Figure contains an axes. The axes with title Weibull Probability Plot contains 3 objects of type line.

График показывает, что данные не следуют за распределением Вейбулла.

Загрузите образцы данных. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует нормальному распределению по различным типам автомобилей. Определите значение p с помощью аппроксимации Монте-Карло с максимальной стандартной ошибкой Монте-Карло, равной 1e-4.

load carbig
[h,p] = lillietest(MPG,'MCTol',1e-4)
h = 1
p = 8.3333e-06

Возвращенное значение h = 1 указывает, что lillietest отвергает нулевую гипотезу о том, что данные поступают из нормального распределения на уровне значимости 5%.

Входные аргументы

свернуть все

Образец данных, указанный как вектор.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Distribution','exponential','Alpha',0.01 проверяет нулевую гипотезу о том, что распределение населения принадлежит семейству экспоненциального распределения на уровне значимости 1%.

Уровень значимости теста гипотезы, определяемый как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1).

  • Если MCTol не используется, Alpha должно находиться в диапазоне [0,001,0,50].

  • Если MCTol используется, Alpha должен находиться в диапазоне (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Семейство распределения для теста гипотезы, указанное как пара, разделенная запятыми, состоящая из 'Distr' и одно из следующих.

'normal'Нормальное распределение
'exponential'Экспоненциальное распределение
'extreme value'Распределение экстремальных значений

  • Проверить x для логнормального распределения, проверить, если log(x) имеет нормальное распределение.

  • Проверить x для распределения Вейбулла, проверить, если log(x) имеет экстремальное распределение значений.

Пример: 'Distribution','exponential'

Максимальная стандартная ошибка Монте-Карло для p, значение p теста, указанное как пара, разделенная запятыми, состоящая из 'MCTol' и скалярное значение в диапазоне (0,1).

Пример: 'MCTol',0.001

Типы данных: single | double

Выходные аргументы

свернуть все

Результат проверки гипотезы, возвращенный как 1 или 0.

  • Если h = 1, это указывает на отклонение нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

p-значение теста, возвращаемое как скалярное значение в диапазоне (0,1). p - вероятность наблюдения проверочной статистики как экстремальной или более экстремальной, чем наблюдаемая величина при нулевой гипотезе. Малые значения p поставить под сомнение достоверность нулевой гипотезы.

  • Если MCTol не используется, p вычисляется с использованием обратной интерполяции в таблицу критических значений и возвращается в виде скалярного значения в диапазоне [0,001,0,50]. lillietest предупреждает, когда p не находится в пределах табличного диапазона и возвращает наименьшее или наибольшее табличное значение.

  • Если MCTol используется, lillietest выполняет моделирование Монте-Карло для вычисления более точного p-значения, и p возвращается как скалярное значение в диапазоне (0,1).

Статистика теста, возвращаемая как неотрицательное скалярное значение.

Критическое значение для теста гипотезы, возвращаемое как неотрицательное скалярное значение.

Подробнее

свернуть все

Тест Лиллиефорса

Тест Лиллиефорса - это двусторонний тест соответствия, подходящий, когда параметры нулевого распределения неизвестны и должны быть оценены. Это в отличие от теста Колмогорова-Смирнова с одним образцом, который требует полного указания нулевого распределения.

Статистика теста Лиллиефорса:

D * = maxx 'F ^ (x) G (x) |,

где F ^ (x) - эмпирический cdf данных выборки, а G (x) - cdf гипотетического распределения с оцененными параметрами, равными параметрам выборки.

lillietest может использоваться для проверки того, является ли вектор данных x имеет логнормальное или Вейбулловое распределение, применяя преобразование к вектору данных и выполняя соответствующий тест Лиллифорса:

  • Проверить x для логнормального распределения, проверить, если log(x) имеет нормальное распределение.

  • Проверить x для распределения Вейбулла, проверить, если log(x) имеет экстремальное распределение значений.

Тест Лиллиефорса не может быть использован, когда нулевая гипотеза не является семейством распределений в масштабе местоположения.

Стандартная ошибка Монте-Карло

Стандартная ошибка Монте-Карло - это ошибка, вызванная моделированием значения p.

Стандартная ошибка Монте-Карло рассчитывается как:

SE = (p ^) (1 − p ^) mcreps,

где p ^ - оценочное значение p теста гипотезы, иmcreps - количество выполненных репликаций Монте-Карло.

Количество реплик Монте-Карло, mcreps, определяется таким образом, что стандартная ошибка Монте-Карло для p ^ меньше значения, указанного дляMCTol.

Алгоритмы

Чтобы вычислить критическое значение для теста гипотезы, lillietest интерполирует в таблицу критических значений, предварительно рассчитанных с использованием моделирования Монте-Карло для размеров выборки менее 1000 и уровней значимости между 0,001 и 0,50. Таблица, используемая lillietest больше и точнее таблицы, первоначально представленной Лиллиефорсом. Если требуется более точное значение p или если требуемый уровень значимости меньше 0,001 или больше 0,50, то MCTol входной аргумент может использоваться для выполнения моделирования Монте-Карло для более точного вычисления p-значения.

Когда вычисленное значение статистики теста превышает критическое значение, lillietest отвергает нулевую гипотезу на уровне значимости Alpha.

lillietest удовольствия NaN значения в x как отсутствующие значения и игнорирует их.

Ссылки

[1] Коновер, В. Дж. Практическая непараметрическая статистика. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1980.

[2] Лиллиефорс, Х. В. «О тесте Колмогорова-Смирнова на экспоненциальное распределение со средним неизвестным». Журнал Американской статистической ассоциации. Том 64, 1969, стр. 387-389.

[3] Лиллифорс, Х. В. «О тесте Колмогорова-Смирнова на нормальность со средним и дисперсией неизвестно». Журнал Американской статистической ассоциации. Том 62, 1967, стр. 399-402.

См. также

| | | |

Представлен до R2006a