adtest

Критерий Андерсона-Дарлинга

Синтаксис

h = adtest(x)
h = adtest(x,Name,Value)
[h,p] = adtest(___)
[h,p,adstat,cv] = adtest(___)

Описание

пример

h = adtest(x) возвращает тестовое решение для нулевой гипотезы, что данные в векторном x от генеральной совокупности с нормальным распределением, с помощью Критерия Андерсона-Дарлинга. Альтернативная гипотеза - то, что x не от генеральной совокупности с нормальным распределением. h результата является 1, если тест отклоняет нулевую гипотезу на 5%-м уровне значения или 0 в противном случае.

пример

h = adtest(x,Name,Value) возвращает тестовое решение для Критерия Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно задать пустое распределение кроме нормального, или выбрать альтернативный метод для вычисления p - значение.

пример

[h,p] = adtest(___) также возвращает p - значение, p, Критерия Андерсона-Дарлинга, с помощью любого из входных параметров от предыдущих синтаксисов.

пример

[h,p,adstat,cv] = adtest(___) также возвращает тестовую статистическую величину, adstat, и критическое значение, cv, для Критерия Андерсона-Дарлинга.

Примеры

свернуть все

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из нормального распределения. Вы не должны задавать значения для параметров генеральной совокупности.

[h,p,adstat,cv] = adtest(x)
h = logical
   0

p = 0.1854
adstat = 0.5194
cv = 0.7470

Возвращенное значение h = 0 указывает, что adtest не удается отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из распределения экстремума. Вы не должны задавать значения для параметров генеральной совокупности.

[h,p] = adtest(x,'Distribution','ev')
h = logical
   0

p = 0.0714

Возвращенное значение h = 0 указывает, что adtest не удается отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Создайте объект нормального распределения вероятностей со средним mu = 75 и стандартным отклонением sigma = 10.

dist = makedist('normal','mu',75,'sigma',10)
dist = 
  NormalDistribution

  Normal distribution
       mu = 75
    sigma = 10

Протестируйте нулевую гипотезу, что x прибывает из предполагавшегося нормального распределения.

[h,p] = adtest(x,'Distribution',dist)
h = logical
   0

p = 0.4687

Возвращенное значение h = 0 указывает, что adtest не удается отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Входные параметры

свернуть все

Выборочные данные, заданные как вектор. Проигнорированы Недостающие наблюдения в x, обозначенном NaN.

Типы данных: single | double

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'MCTol',0.01 проводит тест гипотезы на 1%-м уровне значения и определяет p-значение, p, с помощью симуляции Монте-Карло стандартная погрешность Монте-Карло имеющая для p 0,01.

Предполагавшееся распределение вектора данных x, заданный как пара, разделенная запятой, состоящая из 'Distribution' и одно из следующих.

'norm'Нормальное распределение
'exp'Экспоненциальное распределение
'ev'Распределение экстремума
'logn'Логарифмически нормальное распределение
'weibull'Распределение Weibull

В этом случае вы не должны задавать параметры генеральной совокупности. Вместо этого adtest оценивает параметры распределения от выборочных данных и тестирует x против сложной гипотезы, что это происходит из выбранной семьи распределения с незаданными параметрами.

Также можно задать любой непрерывный объект распределения вероятностей для пустого распределения. В этом случае необходимо задать все параметры распределения, и adtest тестирует x против простой гипотезы, что это прибывает из данного распределения со своими заданными параметрами.

Пример: 'Distribution','exp'

Уровень значения теста гипотезы, заданного как пара, разделенная запятой, состоящая из 'Alpha' и скалярного значения в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Максимальная стандартная погрешность Монте-Карло для p - значение, p, заданный как пара, разделенная запятой, состоящая из 'MCTol' и значения положительной скалярной величины. Если вы используете MCTol, adtest определяет p с помощью симуляции Монте-Карло, и аргумент пары "имя-значение" Asymptotic должен иметь значение false.

Пример: 'MCTol',0.01

Типы данных: single | double

Метод для вычисления p - значение Критерия Андерсона-Дарлинга, заданного как пара, разделенная запятой, состоящая из 'Asymptotic' и или true или false. Если вы задаете 'true', adtest оценивает p - значение с помощью ограничивающего распределения статистической величины Критерия Андерсона-Дарлинга. Если вы задаете false, adtest вычисляет p - значение на основе аналитической формулы. Для объемов выборки, больше, чем 120, ограничивающая оценка распределения, вероятно, будет более точной, чем метод приближения размера небольшой выборки.

  • Если вы задаете семейство распределений с неизвестными параметрами для пары "имя-значение" Distribution, Asymptotic должен быть false.

  • Если вы используете MCTol, чтобы вычислить p - значение с помощью симуляции Монте-Карло, Asymptotic должен быть false.

Пример: 'Asymptotic',true

Типы данных: логический

Выходные аргументы

свернуть все

Результат испытаний гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы на уровне значения Alpha.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу на уровне значения Alpha.

p- Критерия Андерсона-Дарлинга, возвращенного как скалярное значение в области значений [0,1]. p является вероятностью наблюдения тестовой статистической величины как экстремальное значение как, или более экстремальный, чем, наблюдаемая величина по нулевой гипотезе. p вычисляется с помощью одного из этих методов:

  • Если предполагавшееся распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет p аналитически. Если 'Asymptotic' является true, adtest использует асимптотическое распределение тестовой статистической величины. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

  • Если предполагавшееся распределение задано как семейство распределений с неизвестными параметрами, adtest получает критическое значение из таблицы и использует обратную интерполяцию, чтобы определить p - значение. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

Протестируйте статистическую величину на Критерий Андерсона-Дарлинга, возвращенный как скалярное значение.

  • Если предполагавшееся распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет adstat с помощью заданных параметров.

  • Если предполагавшееся распределение задано как семейство распределений с неизвестными параметрами, adtest вычисляет adstat с помощью параметров, оцененных от выборочных данных.

Критическое значение для Критерия Андерсона-Дарлинга на уровне значения Alpha, возвращенный как скалярное значение. adtest определяет cv путем интерполяции в таблицу на основе заданного уровня значения Alpha.

Больше о

свернуть все

Критерий Андерсона-Дарлинга

Критерий Андерсона-Дарлинга обычно используется, чтобы протестировать, прибывает ли выборка данных из нормального распределения. Однако это может использоваться, чтобы протестировать на другой, выдвинул гипотезу распределение, даже если вы не полностью задаете параметры распределения. Вместо этого тест оценивает любые неизвестные параметры от выборки данных.

Тестовая статистическая величина принадлежит семейству квадратичных статистических данных функции эмпирического распределения, которые измеряют расстояние между предполагавшимся распределением, F (x) и эмпирическим cdf, Fn (x) как

n(Fn(x)F(x))w2(x)dF(x),

по упорядоченным демонстрационным значениям x1<x2<...<xn, где w (x) является функцией веса, и n является количеством точек данных в выборке.

Функция веса для Критерия Андерсона-Дарлинга

w(x)=[F(x)(1F(x))]1,

который помещает больший вес в наблюдения в хвостах распределения, таким образом делая тест более чувствительным к выбросам и лучше при обнаружении отклонения от нормальности в хвостах распределения.

Статистическая величина Критерия Андерсона-Дарлинга

An2=ni=1n2i1n[ln(F(Xi))+ln(1F(Xn+1i))],

где{X1<...<Xn} упорядоченные точки выборочных данных, и n является количеством точек данных в выборке.

В adtest решение отклонить или не отклонить нулевую гипотезу основано на сравнении p - значение для теста гипотезы с заданным уровнем значения, не при сравнении тестовой статистической величины с критическим значением.

Стандартная погрешность Монте-Карло

Стандартная погрешность Монте-Карло является ошибкой из-за симуляции p - значение.

Стандартная погрешность Монте-Карло вычисляется как

SE=(p^)(1p^)mcreps,

где p^ предполагаемый p - значение теста гипотезы, и mcreps является количеством выполняемых репликаций Монте-Карло.

adtest выбирает количество репликаций Монте-Карло, mcreps, достаточно большого, чтобы совершить стандартную ошибку Монте-Карло для p^ меньше, чем значение заданы для MCTol.

Смотрите также

|

Введенный в R2013a