adtest

Критерий Андерсона-Дарлинга

Описание

пример

h = adtest(x) возвращает решение теста для нулевой гипотезы, что данные в векторе x из населения с нормальным распределением, с использованием критерия Андерсона-Дарлинга. Альтернативная гипотеза заключается в том, что x не из населения с нормальным распределением. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне 5% значимости, или 0 в противном случае.

пример

h = adtest(x,Name,Value) возвращает решение теста для Критерия Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументы пары "имя-значение". Например, можно задать нулевое распределение, отличное от обычного, или выбрать альтернативный метод для вычисления p -значение.

пример

[h,p] = adtest(___) также возвращает p -значение, p, из критерия Андерсона-Дарлинга, с использованием любого из входных параметров из предыдущих синтаксисов.

пример

[h,p,adstat,cv] = adtest(___) также возвращает тестовую статистику, adstatи критическое значение, cvдля критерия Андерсона-Дарлинга.

Примеры

свернуть все

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.

load examgrades
x = grades(:,1);

Проверьте нулевую гипотезу о том, что оценки экзамена получены из нормального распределения. Вам не нужно задавать значения для параметров населения.

[h,p,adstat,cv] = adtest(x)
h = logical
   0

p = 0.1854
adstat = 0.5194
cv = 0.7470

Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.

load examgrades
x = grades(:,1);

Проверьте нулевую гипотезу о том, что оценки экзамена исходят из экстремального распределения значений. Вам не нужно задавать значения для параметров населения.

[h,p] = adtest(x,'Distribution','ev')
h = logical
   0

p = 0.0714

Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.

load examgrades
x = grades(:,1);

Создайте нормальный объект распределения вероятностей со средними mu = 75 и стандартное отклонение sigma = 10.

dist = makedist('normal','mu',75,'sigma',10)
dist = 
  NormalDistribution

  Normal distribution
       mu = 75
    sigma = 10

Проверьте нулевую гипотезу, что x происходит от гипотезированного нормального распределения.

[h,p] = adtest(x,'Distribution',dist)
h = logical
   0

p = 0.4687

Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.

Входные параметры

свернуть все

Выборочные данные, заданная как вектор. Отсутствующие наблюдения в x, обозначенный NaN, игнорируются.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'MCTol',0.01 проводит проверку гипотезы на уровне 1% значимости и определяет p-значение, p, использование симуляции Монте-Карло с максимальной стандартной ошибкой Монте-Карло для p от 0.01.

Гипотезированное распределение векторных x данных, заданная как разделенная разделенными запятой парами, состоящая из 'Distribution' и одно из следующих.

'norm'Нормальное распределение
'exp'Экспоненциальное распределение
'ev'Экстремальное распределение значений
'logn'Lognormal distribution (
'weibull'Распределение Вейбула

В этом случае вам не нужно задавать параметры населения. Вместо этого, adtest оценивает параметры распределения из выборочных данных и тестов x против составной гипотезы о том, что она происходит из выбранного семейства распределения с параметрами, не заданными.

Кроме того, можно задать любой непрерывный объект распределения вероятностей для нулевого распределения. В этом случае необходимо задать все параметры распределения, и adtest тесты x против простой гипотезы, что она происходит из заданного распределения с заданными параметрами.

Пример: 'Distribution','exp'

Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Максимальная стандартная ошибка Монте-Карло для p -значение, p, заданная как разделенная разделенными запятой парами, состоящая из 'MCTol' и положительная скалярная величина значение. Если вы используете MCTol, adtest определяет p используя симуляцию Монте-Карло и аргумент пары "имя-значение" Asymptotic должно иметь значение false.

Пример: 'MCTol',0.01

Типы данных: single | double

Метод для вычисления p-значения критерия Андерсона-Дарлинга, заданный как разделенная разделенными запятой парами, состоящая из 'Asymptotic' и любой из них true или false. Если вы задаете 'true', adtest оценивает значение p с помощью лимитирующего распределения тестовой статистики Андерсона-Дарлинга. Если вы задаете false, adtest вычисляет значение p на основе аналитической формулы. Для размеров выборки, больше 120, предельная оценка распределения, вероятно, будет более точной, чем метод приближения малого размера выборки.

  • Если вы задаете семейство распределений с неизвестными параметрами для Distribution Пара "имя-значение", Asymptotic должен быть false.

  • Если вы используете MCTol чтобы вычислить p -значение с помощью симуляции Монте-Карло, Asymptotic должен быть false.

Пример: 'Asymptotic',true

Типы данных: logical

Выходные аргументы

свернуть все

Результат теста гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

p значение критерия Андерсона-Дарлинга, возвращенное как скалярное значение в области значений [0,1]. p - вероятность наблюдения тестовой статистики такой же экстремальной, как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. p вычисляется с помощью одного из следующих методов:

  • Если гипотезированное распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет p аналитически. Если 'Asymptotic' является true, adtest использует асимптотическое распределение тестовой статистики. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

  • Если гипотезированное распределение задано как семейство распределений с неизвестными параметрами, adtest извлекает критическое значение из таблицы и использует обратную интерполяцию, чтобы определить p значение. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

Тестовая статистика для критерия Андерсона-Дарлинга, возвращенная в виде скалярного значения.

  • Если гипотезированное распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет adstat использование заданных параметров.

  • Если гипотезированное распределение задано как семейство распределений с неизвестными параметрами, adtest вычисляет adstat использование параметров, оцененных из выборочных данных.

Критическое значение для критерия Андерсона-Дарлинга на уровне значимости Alpha, возвращается как скалярное значение. adtest определяет cv путем интерполяции в таблицу на основе заданных Alpha уровень значимости.

Подробнее о

свернуть все

Критерий Андерсона-Дарлинга

Критерий Андерсона-Дарлинга обычно используется, чтобы проверить, получена ли выборка данных из нормального распределения. Однако его можно использовать для проверки другого гипотезированного распределения, даже если вы не полностью задаете параметры распределения. Вместо этого тест оценивает любые неизвестные параметры из выборки данных.

Тестовая статистика принадлежит к семейству квадратичных статистических данных эмпирических функций распределения, которые измеряют расстояние между гипотезированным распределением, F (x) и эмпирическим cdf, Fn (x) как

n(Fn(x)F(x))w2(x)dF(x),

по упорядоченным выборкам значениям x1<x2<...<xn, где w (x) является весовой функцией, а n - количеством точек данных в выборке.

Весовая функция для критерия Андерсона-Дарлинга

w(x)=[F(x)(1F(x))]1,

который придает больший вес наблюдениям в хвостах распределения, таким образом делая тест более чувствительным к выбросам и лучше обнаруживает уход от нормальности в хвостах распределения.

Статистическая величина Критерия Андерсона-Дарлинга

An2=ni=1n2i1n[ln(F(Xi))+ln(1F(Xn+1i))],

где{X1<...<Xn} являются упорядоченными точками выборочных данных и n является количеством точек данных в выборке.

В adtestрешение отклонить или не отклонять нулевую гипотезу основано на сравнении p-значения для теста гипотезы с заданным уровнем значимости, а не на сравнении тестовой статистики с критическим значением.

Стандартная ошибка Монте-Карло

Стандартная ошибка Монте-Карло является ошибкой из-за симуляции p -значение.

Стандартная ошибка Монте-Карло вычисляется как

SE=(p^)(1p^)mcreps,

где p^ - предполагаемое p -значение теста гипотезы, и mcreps количество выполненных репликаций Monte Carlo.

adtest выбирает количество репликаций Monte Carlo, mcreps, достаточно большой, чтобы сделать стандартную ошибку Монте-Карло для p^ меньше значения, заданного для MCTol.

См. также

|

Введенный в R2013a