adtest

Критерий Андерсона-Дарлинга

Синтаксис

h = adtest(x)

h = adtest(x,Name,Value)

[h,p] =
adtest(___)

[h,p,adstat,cv]
= adtest(___)

Описание

пример

h = adtest(x) возвращает тестовое решение для нулевой гипотезы, что данные в векторном x от генеральной совокупности с нормальным распределением, с помощью Критерия Андерсона-Дарлинга. Альтернативная гипотеза - то, что x не от генеральной совокупности с нормальным распределением. h результата является 1, если тест отклоняет нулевую гипотезу на 5%-м уровне значения или 0 в противном случае.

пример

h = adtest(x,Name,Value) возвращает тестовое решение для Критерия Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно задать пустое распределение кроме нормального, или выбрать альтернативный метод для вычисления p - значение.

пример

[h,p] = adtest(___) также возвращает p - значение, p, Критерия Андерсона-Дарлинга, с помощью любого из входных параметров от предыдущих синтаксисов.

пример

[h,p,adstat,cv] = adtest(___) также возвращает тестовую статистическую величину, adstat, и критическое значение, cv, для Критерия Андерсона-Дарлинга.

Примеры

свернуть все

Критерий Андерсона-Дарлинга для нормального распределения

Скрипт Open Live Script

Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных о классах экзамена студентов.

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из нормального распределения. Вы не должны задавать значения для параметров генеральной совокупности.

[h,p,adstat,cv] = adtest(x)

h = logical
   0

p = 0.1854

adstat = 0.5194

cv = 0.7470

Возвращенное значение h = 0 указывает, что adtest не удается отклонить нулевую гипотезу на 5%-м уровне значения по умолчанию.

Критерий Андерсона-Дарлинга для распределения экстремума

Скрипт Open Live Script

load examgrades
x = grades(:,1);

Протестируйте нулевую гипотезу, что классы экзамена прибывают из распределения экстремума. Вы не должны задавать значения для параметров генеральной совокупности.

[h,p] = adtest(x,'Distribution','ev')

h = logical
   0

p = 0.0714

Критерий Андерсона-Дарлинга Используя заданное распределение вероятностей

Скрипт Open Live Script

load examgrades
x = grades(:,1);

Создайте объект нормального распределения вероятностей со средним mu = 75 и стандартным отклонением sigma = 10.

dist = makedist('normal','mu',75,'sigma',10)

dist = 
  NormalDistribution

  Normal distribution
       mu = 75
    sigma = 10

Протестируйте нулевую гипотезу, что x прибывает из предполагавшегося нормального распределения.

[h,p] = adtest(x,'Distribution',dist)

h = logical
   0

p = 0.4687

Входные параметры

свернуть все

`x` Выборочные данные
вектор

Выборочные данные, заданные как вектор. Проигнорированы Недостающие наблюдения в x, обозначенном NaN.

Типы данных: single | double

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'MCTol',0.01 проводит тест гипотезы на 1%-м уровне значения и определяет p-значение, p, с помощью симуляции Монте-Карло стандартная погрешность Монте-Карло имеющая для p 0,01.

`'Distribution'` — Предполагавшееся распределение
`'norm'` (значение по умолчанию) | `'exp'` | `'ev'` | `'logn'` | `'weibull'` | объект распределения вероятностей

Предполагавшееся распределение вектора данных x, заданный как пара, разделенная запятой, состоящая из 'Distribution' и одно из следующих.

`'norm'`	Нормальное распределение
`'exp'`	Экспоненциальное распределение
`'ev'`	Распределение экстремума
`'logn'`	Логарифмически нормальное распределение
`'weibull'`	Распределение Weibull

В этом случае вы не должны задавать параметры генеральной совокупности. Вместо этого adtest оценивает параметры распределения от выборочных данных и тестирует x против сложной гипотезы, что это происходит из выбранной семьи распределения с незаданными параметрами.

Также можно задать любой непрерывный объект распределения вероятностей для пустого распределения. В этом случае необходимо задать все параметры распределения, и adtest тестирует x против простой гипотезы, что это прибывает из данного распределения со своими заданными параметрами.

Пример: 'Distribution','exp'

`\alpha` Уровень значения
`0.05` (значение по умолчанию) | скалярное значение в области значений (0,1)

Уровень значения теста гипотезы, заданного как пара, разделенная запятой, состоящая из 'Alpha' и скалярного значения в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

`'MCTol'` — Максимальная стандартная погрешность Монте-Карло
значение положительной скалярной величины

Максимальная стандартная погрешность Монте-Карло для p - значение, p, заданный как пара, разделенная запятой, состоящая из 'MCTol' и значения положительной скалярной величины. Если вы используете MCTol, adtest определяет p с помощью симуляции Монте-Карло, и аргумент пары "имя-значение" Asymptotic должен иметь значение false.

Пример: 'MCTol',0.01

Типы данных: single | double

`'Asymptotic'` — Метод для вычисления p - значение
`false` (значение по умолчанию) | `true`

Метод для вычисления p - значение Критерия Андерсона-Дарлинга, заданного как пара, разделенная запятой, состоящая из 'Asymptotic' и или true или false. Если вы задаете 'true', adtest оценивает p - значение с помощью ограничивающего распределения статистической величины Критерия Андерсона-Дарлинга. Если вы задаете false, adtest вычисляет p - значение на основе аналитической формулы. Для объемов выборки, больше, чем 120, ограничивающая оценка распределения, вероятно, будет более точной, чем метод приближения размера небольшой выборки.

Если вы задаете семейство распределений с неизвестными параметрами для пары "имя-значение" Distribution, Asymptotic должен быть false.
Если вы используете MCTol, чтобы вычислить p - значение с помощью симуляции Монте-Карло, Asymptotic должен быть false.

Пример: 'Asymptotic',true

Типы данных: логический

Выходные аргументы

свернуть все

`h` Результат испытаний гипотезы
1 | 0

Результат испытаний гипотезы, возвращенный как логическое значение.

Если h = 1, это указывает на отклонение нулевой гипотезы на уровне значения Alpha.
Если h = 0, это указывает на отказ отклонить нулевую гипотезу на уровне значения Alpha.

`p` — p - значение
скалярное значение в области значений [0,1]

p- Критерия Андерсона-Дарлинга, возвращенного как скалярное значение в области значений [0,1]. p является вероятностью наблюдения тестовой статистической величины как экстремальное значение как, или более экстремальный, чем, наблюдаемая величина по нулевой гипотезе. p вычисляется с помощью одного из этих методов:

Если предполагавшееся распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет p аналитически. Если 'Asymptotic' является true, adtest использует асимптотическое распределение тестовой статистической величины. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.
Если предполагавшееся распределение задано как семейство распределений с неизвестными параметрами, adtest получает критическое значение из таблицы и использует обратную интерполяцию, чтобы определить p - значение. Если вы задаете значение для 'MCTol', adtest использует симуляцию Монте-Карло.

`adstat` — Тестовая статистическая величина
скалярное значение

Протестируйте статистическую величину на Критерий Андерсона-Дарлинга, возвращенный как скалярное значение.

Если предполагавшееся распределение является полностью заданным объектом распределения вероятностей, adtest вычисляет adstat с помощью заданных параметров.
Если предполагавшееся распределение задано как семейство распределений с неизвестными параметрами, adtest вычисляет adstat с помощью параметров, оцененных от выборочных данных.

`cv` — Критическое значение
скалярное значение

Критическое значение для Критерия Андерсона-Дарлинга на уровне значения Alpha, возвращенный как скалярное значение. adtest определяет cv путем интерполяции в таблицу на основе заданного уровня значения Alpha.

Больше о

свернуть все

Критерий Андерсона-Дарлинга

Критерий Андерсона-Дарлинга обычно используется, чтобы протестировать, прибывает ли выборка данных из нормального распределения. Однако это может использоваться, чтобы протестировать на другой, выдвинул гипотезу распределение, даже если вы не полностью задаете параметры распределения. Вместо этого тест оценивает любые неизвестные параметры от выборки данных.

Тестовая статистическая величина принадлежит семейству квадратичных статистических данных функции эмпирического распределения, которые измеряют расстояние между предполагавшимся распределением, F (x) и эмпирическим cdf, _Fn (x) как

$n \int_{- \infty}^{\infty} (F_{n} (x) - F (x)) {}^{2}w (x) d F (x),$

по упорядоченным демонстрационным значениям $x_{1} < x_{2} < ... < x_{n}$ , где w (x) является функцией веса, и n является количеством точек данных в выборке.

Функция веса для Критерия Андерсона-Дарлинга

$w (x) = {[F (x) (1 - F (x))]}^{- 1},$

который помещает больший вес в наблюдения в хвостах распределения, таким образом делая тест более чувствительным к выбросам и лучше при обнаружении отклонения от нормальности в хвостах распределения.

Статистическая величина Критерия Андерсона-Дарлинга

$A_{n}^{2} = - n - \sum_{i = 1}^{n} \frac{2 i - 1}{n} [\ln (F (X_{i})) + \ln (1 - F (X_{n + 1 - i}))],$

где ${X_{1} < ... < X_{n}}$ упорядоченные точки выборочных данных, и n является количеством точек данных в выборке.

В adtest решение отклонить или не отклонить нулевую гипотезу основано на сравнении p - значение для теста гипотезы с заданным уровнем значения, не при сравнении тестовой статистической величины с критическим значением.

Стандартная погрешность Монте-Карло

Стандартная погрешность Монте-Карло является ошибкой из-за симуляции p - значение.

Стандартная погрешность Монте-Карло вычисляется как

$S E = \sqrt{\frac{(\hat{p}) (1 - \hat{p})}{mcreps}},$

где $\hat{p}$ предполагаемый p - значение теста гипотезы, и mcreps является количеством выполняемых репликаций Монте-Карло.

adtest выбирает количество репликаций Монте-Карло, mcreps, достаточно большого, чтобы совершить стандартную ошибку Монте-Карло для $\hat{p}$ меньше, чем значение заданы для MCTol.

Смотрите также

jbtest | kstest

Документация

adtest

Синтаксис

Описание

Примеры

Критерий Андерсона-Дарлинга для нормального распределения

Критерий Андерсона-Дарлинга для распределения экстремума

Критерий Андерсона-Дарлинга Используя заданное распределение вероятностей

Входные параметры

`x` Выборочные данные
вектор

Аргументы в виде пар имя-значение

`'Distribution'` — Предполагавшееся распределение
`'norm'` (значение по умолчанию) | `'exp'` | `'ev'` | `'logn'` | `'weibull'` | объект распределения вероятностей

`\alpha` Уровень значения
`0.05` (значение по умолчанию) | скалярное значение в области значений (0,1)

`'MCTol'` — Максимальная стандартная погрешность Монте-Карло
значение положительной скалярной величины

`'Asymptotic'` — Метод для вычисления p - значение
`false` (значение по умолчанию) | `true`

Выходные аргументы

`h` Результат испытаний гипотезы
1 | 0

`p` — p - значение
скалярное значение в области значений [0,1]

`adstat` — Тестовая статистическая величина
скалярное значение

`cv` — Критическое значение
скалярное значение

Больше о

Критерий Андерсона-Дарлинга

Стандартная погрешность Монте-Карло

Смотрите также

Введенный в R2013a

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

adtest

Синтаксис

Описание

Примеры

Критерий Андерсона-Дарлинга для нормального распределения

Критерий Андерсона-Дарлинга для распределения экстремума

Критерий Андерсона-Дарлинга Используя заданное распределение вероятностей

Входные параметры

x Выборочные данные вектор

Аргументы в виде пар имя-значение

'Distribution' — Предполагавшееся распределение 'norm' (значение по умолчанию) | 'exp' | 'ev' | 'logn' | 'weibull' | объект распределения вероятностей

\alpha Уровень значения 0.05 (значение по умолчанию) | скалярное значение в области значений (0,1)

'MCTol' — Максимальная стандартная погрешность Монте-Карло значение положительной скалярной величины

'Asymptotic' — Метод для вычисления p - значение false (значение по умолчанию) | true

Выходные аргументы

h Результат испытаний гипотезы1 | 0

p — p - значение скалярное значение в области значений [0,1]

adstat — Тестовая статистическая величина скалярное значение

cv — Критическое значение скалярное значение

Больше о

Критерий Андерсона-Дарлинга

Стандартная погрешность Монте-Карло

Смотрите также

Введенный в R2013a

Документация Statistics and Machine Learning Toolbox

Поддержка

`x` Выборочные данные
вектор

`'Distribution'` — Предполагавшееся распределение
`'norm'` (значение по умолчанию) | `'exp'` | `'ev'` | `'logn'` | `'weibull'` | объект распределения вероятностей

`\alpha` Уровень значения
`0.05` (значение по умолчанию) | скалярное значение в области значений (0,1)

`'MCTol'` — Максимальная стандартная погрешность Монте-Карло
значение положительной скалярной величины

`'Asymptotic'` — Метод для вычисления p - значение
`false` (значение по умолчанию) | `true`

`h` Результат испытаний гипотезы
1 | 0

`p` — p - значение
скалярное значение в области значений [0,1]

`adstat` — Тестовая статистическая величина
скалярное значение

`cv` — Критическое значение
скалярное значение