lillietest

Описание

пример

h = lillietest(x) возвращает решение теста для нулевой гипотезы, что данные в векторе x происходит от распределения в нормальном семействе, против альтернативы, что оно не происходит от такого распределения, с помощью теста Лиллифорса. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне 5% значимости и 0 в противном случае.

пример

h = lillietest(x,Name,Value) возвращает решение теста с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно проверить данные на соответствие другому семейству распределений, изменить уровень значимости или вычислить значение p с помощью приближения Монте-Карло.

пример

[h,p] = lillietest(___) также возвращает p-значение p, с использованием любого из входных параметров из предыдущих синтаксисов.

пример

[h,p,kstat,critval] = lillietest(___) также возвращает тестовую статистику kstat и критическое значение critval для теста.

Примеры

свернуть все

Загрузите выборочные данные. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует нормальному распределению между различными марками автомобилей.

load carbig
[h,p,k,c] = lillietest(MPG)
Warning: P is less than the smallest tabulated value, returning 0.001.
h = 1
p = 1.0000e-03
k = 0.0789
c = 0.0451

Тестовая статистическая k больше критического значения c, так lillietest возвращает результат h = 1 для указания отказа от нулевой гипотезы на уровне значимости по умолчанию 5%. Предупреждение указывает, что возвращенный p-value меньше наименьшего значения в таблице предварительно вычисленных значений. Чтобы найти более точный p-значение, использование MCTol чтобы запустить приближение Монте-Карло. См. «Определение значения p с использованием приближения Монте-Карло».

Загрузите выборочные данные. Создать вектор, содержащий первый столбец данных экзаменационных оценок учащихся.

load examgrades
x = grades(:,1);

Проверьте нулевую гипотезу о том, что выборочные данные происходят из нормального распределения на уровне значимости 1%.

[h,p] = lillietest(x,'Alpha',0.01)
h = 0
p = 0.0348

Возвращенное значение h = 0 указывает, что lillietest не отклоняет нулевую гипотезу на уровне значимости 1%.

Загрузите выборочные данные. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует экспоненциальному распределению между различными марками автомобилей.

load carbig
h = lillietest(MPG,'Distribution','exponential')
h = 1

Возвращенное значение h = 1 указывает, что lillietest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Сгенерируйте два набора выборочных данных, один из распределения Вейбула и другой из логнормального распределения. Выполните тест Lilliefors, чтобы оценить, получен ли каждый набор данных из распределения Вейбула. Подтвердите решение теста, выполнив визуальное сравнение с помощью вероятностного графика Вейбула (wblplot).

Сгенерируйте выборки из распределения Вейбула.

rng('default')
data1 = wblrnd(0.5,2,[500,1]);

Выполните тест Lilliefors при помощи lillietest. Чтобы протестировать данные для распределения Вейбула, проверьте, имеет ли логарифм данных экстремальное распределение значений.

h1 = lillietest(log(data1),'Distribution','extreme value')
h1 = 0

Возвращенное значение h1 = 0 указывает, что lillietest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%. Подтвердите решение теста с помощью графика вероятностей Вейбула.

wblplot(data1)

Figure contains an axes. The axes with title Weibull Probability Plot contains 3 objects of type line.

График указывает, что данные следуют за распределением Вейбула.

Сгенерируйте выборки из логнормального распределения.

data2 =lognrnd(5,2,[500,1]);

Выполните тест Lilliefors.

h2 = lillietest(log(data2),'Distribution','extreme value')
h2 = 1

Возвращенное значение h2 = 1 указывает, что lillietest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%. Подтвердите решение теста с помощью графика вероятностей Вейбула.

wblplot(data2)

Figure contains an axes. The axes with title Weibull Probability Plot contains 3 objects of type line.

График указывает, что данные не следуют распределению Вейбула.

Загрузите выборочные данные. Проверьте нулевую гипотезу о пробеге автомобиля в милях на галлон (MPG), следует нормальному распределению между различными марками автомобилей. Определите, p- значение с использованием приближения Монте-Карло с максимальной стандартной ошибкой Монте-Карло 1e-4.

load carbig
[h,p] = lillietest(MPG,'MCTol',1e-4)
h = 1
p = 8.3333e-06

Возвращенное значение h = 1 указывает, что lillietest отклоняет нулевую гипотезу о том, что данные поступают из нормального распределения на уровне 5% значимости.

Входные параметры

свернуть все

Выборочные данные, заданная как вектор.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Distribution','exponential','Alpha',0.01 проверяет нулевую гипотезу о том, что распределение населения принадлежит семейству экспоненциального распределения на уровне значимости 1%.

Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

  • Если MCTol не используется, Alpha должно находиться в области значений [0,001,0,50].

  • Если MCTol используется, Alpha должно находиться в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Семейство распределений для теста гипотезы, заданное как разделенная разделенными запятой парами, состоящая из 'Distr' и одно из следующих.

'normal'Нормальное распределение
'exponential'Экспоненциальное распределение
'extreme value'Экстремальное распределение значений

  • Для тестирования x для lognormal распределения, тест, если log(x) имеет нормальное распределение.

  • Для тестирования x для распределения Вейбула тестируйте, если log(x) имеет экстремальное распределение значений.

Пример: 'Distribution','exponential'

Максимальная стандартная ошибка Монте-Карло для p, p -значение теста, заданное как разделенная разделенными запятой парами, состоящая из 'MCTol' и скалярное значение в области значений (0,1).

Пример: 'MCTol',0.001

Типы данных: single | double

Выходные аргументы

свернуть все

Результат теста гипотезы, возвращенный как 1 или 0.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

p значение теста, возвращенное как скалярное значение в области значений (0,1). p - вероятность наблюдения тестовой статистики такой же экстремальной, как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. Малые значения p ставит под сомнение валидность нулевой гипотезы.

  • Если MCTol не используется, p вычисляется с помощью обратной интерполяции в таблицу критических значений и возвращается как скалярное значение в области значений [0,001,0,50]. lillietest предупреждает, когда p не найден в табличной области значений и возвращает наименьшее или самое большое табличное значение.

  • Если MCTol используется, lillietest проводит симуляцию Монте-Карло, чтобы вычислить более точное p значение и p возвращается как скалярное значение в области значений (0,1).

Тестовая статистика, возвращенная как неотрицательное скалярное значение.

Критическое значение для теста гипотезы, возвращенное как неотрицательное скалярное значение.

Подробнее о

свернуть все

Тест Лилифорса

Тест Лиллифорса является двусторонним тестом качества подгонки, подходящим, когда параметры нулевого распределения неизвестны и должны быть оценены. Это в отличие от одновыборочного критерия Колмогорова-Смирнова, которая требует, чтобы нулевое распределение было полностью задано.

Тестовая статистика Lilliefors:

D*=maxx|F^(x)G(x)|,

где F^(x) является эмпирическим cdf выборочных данных и G(x) - cdf гипотезированного распределения с оцененными параметрами, равными параметрам выборки.

lillietest может использоваться, чтобы проверить, является ли вектор данных x имеет логнормальное распределение или распределение Вейбула путем применения преобразования к вектору данных и выполнения соответствующего теста Лиллифорса:

  • Для тестирования x для lognormal распределения, тест, если log(x) имеет нормальное распределение.

  • Для тестирования x для распределения Вейбула тестируйте, если log(x) имеет экстремальное распределение значений.

Тест Лиллифорса не может использоваться, когда нулевая гипотеза не является семейством распределений по шкале местоположения.

Стандартная ошибка Монте-Карло

Стандартная ошибка Монте-Карло является ошибкой из-за симуляции p -значение.

Стандартная ошибка Монте-Карло вычисляется как:

SE=(p^)(1p^)mcreps,

где p^ - предполагаемое p -значение теста гипотезы, и mcreps количество выполненных репликаций Monte Carlo.

Количество тиражей Монте-Карло, mcreps, определяется таким образом, что стандартная ошибка Монте-Карло для p^ меньше значения, заданного для MCTol.

Алгоритмы

Чтобы вычислить критическое значение для теста гипотезы, lillietest интерполируется в таблицу критических значений, предварительно вычисленных с помощью симуляции Монте-Карло для размеров выборки менее 1000 и уровней значимости от 0,001 до 0,50. Таблица, используемая lillietest больше и точнее таблицы, первоначально введенной Лиллифорсом. Если желательно более точное p-значение или если желаемый уровень значимости меньше 0,001 или больше 0,50, MCTol входной параметр может использоваться для выполнения симуляции Монте-Карло, чтобы вычислить p -значение более точно.

Когда вычисленное значение тестовой статистики больше критического значения, lillietest отклоняет нулевую гипотезу на уровне значимости Alpha.

lillietest лечит NaN значения в x как отсутствующие значения и игнорирует их.

Ссылки

[1] Conover, W. J. Practical Nonparametric Statistics. Hoboken, NJ: John Wiley & Sons, Inc., 1980.

[2] Lilliefors, H. W. «On the Kolmogorov-Smirnov test for the exponential distribution with mear unknown». Журнал Американской статистической ассоциации. Том 64, 1969, с. 387-389.

[3] Lilliefors, H. W. «On the Kolmogorov-Smirnov test for normality with mean and dariance unknown». Журнал Американской статистической ассоциации. Том 62, 1967, с. 399-402.

См. также

| | | |

Представлено до R2006a