adtest

Критерий Андерсона-Дарлинга

Описание

пример

h = adtest(x) возвращает тестовое решение для нулевой гипотезы что данные в векторном x от населения с нормальным распределением, с помощью Критерия Андерсона-Дарлинга. Альтернативной гипотезой является тот x не от населения с нормальным распределением. Результат h 1 если тест отклоняет нулевую гипотезу на 5%-м уровне значения или 0 в противном случае.

пример

h = adtest(x,Name,Value) возвращает тестовое решение для Критерия Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно задать пустое распределение кроме нормального, или выбрать альтернативный метод для вычисления p - значение.

пример

[h,p] = adtest(___) также возвращает p - значение, p, из Критерия Андерсона-Дарлинга, с помощью любого из входных параметров от предыдущих синтаксисов.

пример

[h,p,adstat,cv] = adtest(___) также возвращает тестовую статистическую величину, adstat, и критическое значение, cv, для Критерия Андерсона-Дарлинга.

Примеры

свернуть все

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из нормального распределения. Вы не должны задавать значения для параметров населения.

[h,p,adstat,cv] = adtest(x)
h = logical
   0

p = 0.1854
adstat = 0.5194
cv = 0.7470

Возвращенное значение h = 0 указывает на тот adtest сбои, чтобы отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из распределения экстремума. Вы не должны задавать значения для параметров населения.

[h,p] = adtest(x,'Distribution','ev')
h = logical
   0

p = 0.0714

Возвращенное значение h = 0 указывает на тот adtest сбои, чтобы отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Создайте объект нормального распределения вероятностей со средним mu = 75 и стандартное отклонение sigma = 10.

dist = makedist('normal','mu',75,'sigma',10)
dist = 
  NormalDistribution

  Normal distribution
       mu = 75
    sigma = 10

Протестируйте нулевую гипотезу что x прибывает из предполагавшегося нормального распределения.

[h,p] = adtest(x,'Distribution',dist)
h = logical
   0

p = 0.4687

Возвращенное значение h = 0 указывает на тот adtest сбои, чтобы отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Входные параметры

свернуть все

Выборочные данные, заданные как вектор. Недостающие наблюдения в x, обозначенный NaN, проигнорированы.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'MCTol',0.01 проводит тест гипотезы на 1%-м уровне значения и определяет p-значение, p, использование симуляции Монте-Карло стандартная погрешность Монте-Карло имеющая для p из 0,01.

Предполагавшееся распределение вектора данных x, заданный как разделенная запятой пара, состоящая из 'Distribution' и одно из следующих.

'norm'Нормальное распределение
'exp'Экспоненциальное распределение
'ev'Распределение экстремума
'logn'Логарифмически нормальное распределение
'weibull'Распределение Weibull

В этом случае вы не должны задавать параметры населения. Вместо этого adtest оценивает параметры распределения от выборочных данных и тестирует x против сложной гипотезы, что это происходит из выбранной семьи распределения незаданными параметрами.

В качестве альтернативы можно задать любой непрерывный объект вероятностного распределения для пустого распределения. В этом случае необходимо задать все параметры распределения и adtest тесты x против простой гипотезы, что это прибывает из данного распределения своими заданными параметрами.

Пример: 'Distribution','exp'

Уровень значения теста гипотезы, заданного как разделенная запятой пара, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Максимальная стандартная погрешность Монте-Карло для p - значение, p, заданный как разделенная запятой пара, состоящая из 'MCTol' и значение положительной скалярной величины. Если вы используете MCTol, adtest определяет p использование симуляции Монте-Карло и аргумента пары "имя-значение" Asymptotic должен иметь значение false.

Пример: 'MCTol',0.01

Типы данных: single | double

Метод для вычисления p - значение Критерия Андерсона-Дарлинга, заданного как разделенная запятой пара, состоящая из 'Asymptotic' и любой true или false. Если вы задаете 'true', adtest оценивает p - значение с помощью ограничивающего распределения статистической величины Критерия Андерсона-Дарлинга. Если вы задаете false, adtest вычисляет p - значение на основе аналитической формулы. Для объемов выборки, больше, чем 120, ограничивающая оценка распределения, вероятно, будет более точной, чем метод приближения размера небольшой выборки.

  • Если вы задаете семейство распределений неизвестными параметрами для Distribution пара "имя-значение", Asymptotic должен быть false.

  • Если вы используете MCTol вычислить p - значение с помощью симуляции Монте-Карло, Asymptotic должен быть false.

Пример: 'Asymptotic',true

Типы данных: логический

Выходные аргументы

свернуть все

Результат испытаний гипотезы, возвращенный как логическое значение.

  • Если h= 1 , это указывает на отклонение нулевой гипотезы в Alpha уровень значения.

  • Если h= 0 , это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значения.

p- Критерия Андерсона-Дарлинга, возвращенного как скалярное значение в области значений [0,1]. p вероятность наблюдения тестовой статистической величины как экстремальное значение как, или более экстремальный, чем, наблюдаемая величина по нулевой гипотезе. p вычисляется с помощью одного из этих методов:

  • Если предполагавшееся распределение является полностью заданным объектом вероятностного распределения, adtest вычисляет p аналитически. Если 'Asymptotic' true, adtest использует асимптотическое распределение тестовой статистической величины. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

  • Если предполагавшееся распределение задано как семейство распределений неизвестными параметрами, adtest получает критическое значение из таблицы и использует обратную интерполяцию, чтобы определить p - значение. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

Протестируйте статистическую величину на Критерий Андерсона-Дарлинга, возвращенный как скалярное значение.

  • Если предполагавшееся распределение является полностью заданным объектом вероятностного распределения, adtest вычисляет adstat использование заданных параметров.

  • Если предполагавшееся распределение задано как семейство распределений неизвестными параметрами, adtest вычисляет adstat использование параметров оценивается от выборочных данных.

Критическое значение для Критерия Андерсона-Дарлинга на уровне значения Alpha, возвращенный как скалярное значение. adtest определяет cv путем интерполяции в таблицу на основе заданного Alpha уровень значения.

Больше о

свернуть все

Критерий Андерсона-Дарлинга

Критерий Андерсона-Дарлинга обычно используется, чтобы протестировать, прибывает ли выборка данных из нормального распределения. Однако это может использоваться, чтобы протестировать на другой, выдвинул гипотезу распределение, даже если вы не полностью задаете параметры распределения. Вместо этого тест оценивает любые неизвестные параметры от выборки данных.

Тестовая статистическая величина принадлежит семейству квадратичных статистических данных функции эмпирического распределения, которые измеряют расстояние между предполагавшимся распределением, F (x) и эмпирическим cdf, Fn (x) как

n(Fn(x)F(x))w2(x)dF(x),

по упорядоченным демонстрационным значениям x1<x2<...<xn, где w (x) является функцией веса, и n является количеством точек данных в выборке.

Функция веса для Критерия Андерсона-Дарлинга

w(x)=[F(x)(1F(x))]1,

который помещает больший вес в наблюдения в хвостах распределения, таким образом делая тест более чувствительным к выбросам и лучше при обнаружении отклонения от нормальности в хвостах распределения.

Статистическая величина Критерия Андерсона-Дарлинга

An2=ni=1n2i1n[ln(F(Xi))+ln(1F(Xn+1i))],

где{X1<...<Xn} упорядоченные точки выборочных данных, и n является количеством точек данных в выборке.

В adtest, решение отклонить или не отклонить нулевую гипотезу основано на сравнении p - значение для теста гипотезы с заданным уровнем значения, не при сравнении тестовой статистической величины с критическим значением.

Стандартная погрешность Монте-Карло

Стандартная погрешность Монте-Карло является ошибкой из-за симуляции p - значение.

Стандартная погрешность Монте-Карло вычисляется как

SE=(p^)(1p^)mcreps,

где p^ предполагаемый p - значение теста гипотезы и mcreps количество выполняемых репликаций Монте-Карло.

adtest выбирает количество репликаций Монте-Карло, mcreps, достаточно большой, чтобы совершить стандартную ошибку Монте-Карло для p^ меньше, чем значение заданы для MCTol.

Смотрите также

|

Введенный в R2013a