Критерий Андерсона-Дарлинга
возвращает решение теста для нулевой гипотезы, что данные в векторе h
= adtest(x
)x
из населения с нормальным распределением, с использованием критерия Андерсона-Дарлинга. Альтернативная гипотеза заключается в том, что x
не из населения с нормальным распределением. Результат h
является 1
если тест отклоняет нулевую гипотезу на уровне 5% значимости, или 0
в противном случае.
возвращает решение теста для Критерия Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументы пары "имя-значение". Например, можно задать нулевое распределение, отличное от обычного, или выбрать альтернативный метод для вычисления p -значение.h
= adtest(x
,Name,Value
)
Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.
load examgrades
x = grades(:,1);
Проверьте нулевую гипотезу о том, что оценки экзамена получены из нормального распределения. Вам не нужно задавать значения для параметров населения.
[h,p,adstat,cv] = adtest(x)
h = logical
0
p = 0.1854
adstat = 0.5194
cv = 0.7470
Возвращенное значение h = 0
указывает, что adtest
не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.
load examgrades
x = grades(:,1);
Проверьте нулевую гипотезу о том, что оценки экзамена исходят из экстремального распределения значений. Вам не нужно задавать значения для параметров населения.
[h,p] = adtest(x,'Distribution','ev')
h = logical
0
p = 0.0714
Возвращенное значение h = 0
указывает, что adtest
не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
Загрузите выборочные данные. Создайте вектор, содержащий первый столбец данных экзаменационных оценок учащихся.
load examgrades
x = grades(:,1);
Создайте нормальный объект распределения вероятностей со средними mu = 75
и стандартное отклонение sigma = 10
.
dist = makedist('normal','mu',75,'sigma',10)
dist = NormalDistribution Normal distribution mu = 75 sigma = 10
Проверьте нулевую гипотезу, что x
происходит от гипотезированного нормального распределения.
[h,p] = adtest(x,'Distribution',dist)
h = logical
0
p = 0.4687
Возвращенное значение h = 0
указывает, что adtest
не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
x
- Выборочные данныеВыборочные данные, заданная как вектор. Отсутствующие наблюдения в x
, обозначенный NaN
, игнорируются.
Типы данных: single
| double
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
'Alpha',0.01,'MCTol',0.01
проводит проверку гипотезы на уровне 1% значимости и определяет p-значение, p
, использование симуляции Монте-Карло с максимальной стандартной ошибкой Монте-Карло для p
от 0.01.'Distribution'
- Гипотезированное распределение'norm'
(по умолчанию) | 'exp'
| 'ev'
| 'logn'
| 'weibull'
| объект распределения вероятностейГипотезированное распределение векторных x
данных, заданная как разделенная разделенными запятой парами, состоящая из
'Distribution'
и одно из следующих.
'norm' | Нормальное распределение |
'exp' | Экспоненциальное распределение |
'ev' | Экстремальное распределение значений |
'logn' | Lognormal distribution ( |
'weibull' | Распределение Вейбула |
В этом случае вам не нужно задавать параметры населения. Вместо этого, adtest
оценивает параметры распределения из выборочных данных и тестов x
против составной гипотезы о том, что она происходит из выбранного семейства распределения с параметрами, не заданными.
Кроме того, можно задать любой непрерывный объект распределения вероятностей для нулевого распределения. В этом случае необходимо задать все параметры распределения, и adtest
тесты x
против простой гипотезы, что она происходит из заданного распределения с заданными параметрами.
Пример: 'Distribution','exp'
'Alpha'
- Уровень значимости0.05
(по умолчанию) | скалярное значение в области значений (0,1)Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha'
и скалярное значение в области значений (0,1).
Пример: 'Alpha',0.01
Типы данных: single
| double
'MCTol'
- Максимальная стандартная ошибка Монте-КарлоМаксимальная стандартная ошибка Монте-Карло для p -значение, p
, заданная как разделенная разделенными запятой парами, состоящая из 'MCTol'
и положительная скалярная величина значение. Если вы используете MCTol
, adtest
определяет p
используя симуляцию Монте-Карло и аргумент пары "имя-значение" Asymptotic
должно иметь значение false
.
Пример: 'MCTol',0.01
Типы данных: single
| double
'Asymptotic'
- Метод вычисления p -значениеfalse
(по умолчанию) | true
Метод для вычисления p-значения критерия Андерсона-Дарлинга, заданный как разделенная разделенными запятой парами, состоящая из 'Asymptotic'
и любой из них true
или false
. Если вы задаете 'true'
, adtest
оценивает значение p с помощью лимитирующего распределения тестовой статистики Андерсона-Дарлинга. Если вы задаете false
, adtest
вычисляет значение p на основе аналитической формулы. Для размеров выборки, больше 120, предельная оценка распределения, вероятно, будет более точной, чем метод приближения малого размера выборки.
Если вы задаете семейство распределений с неизвестными параметрами для Distribution
Пара "имя-значение", Asymptotic
должен быть false
.
Если вы используете MCTol
чтобы вычислить p -значение с помощью симуляции Монте-Карло, Asymptotic
должен быть false
.
Пример: 'Asymptotic',true
Типы данных: logical
h
- Результат теста гипотезы1
| 0
Результат теста гипотезы, возвращенный как логическое значение.
Если h
= 1
, это указывает на отказ от нулевой гипотезы в Alpha
уровень значимости.
Если h
= 0
, это указывает на отказ отклонить нулевую гипотезу в Alpha
уровень значимости.
p
- p -значениеp значение критерия Андерсона-Дарлинга, возвращенное как скалярное значение в области значений [0,1]. p
- вероятность наблюдения тестовой статистики такой же экстремальной, как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. p
вычисляется с помощью одного из следующих методов:
Если гипотезированное распределение является полностью заданным объектом распределения вероятностей, adtest
вычисляет p
аналитически. Если 'Asymptotic'
является true
, adtest
использует асимптотическое распределение тестовой статистики. Если вы задаете значение для 'MCTol'
, adtest
использует симуляцию Монте-Карло.
Если гипотезированное распределение задано как семейство распределений с неизвестными параметрами, adtest
извлекает критическое значение из таблицы и использует обратную интерполяцию, чтобы определить p значение. Если вы задаете значение для 'MCTol'
, adtest
использует симуляцию Монте-Карло.
adstat
- Тестовая статистикаТестовая статистика для критерия Андерсона-Дарлинга, возвращенная в виде скалярного значения.
Если гипотезированное распределение является полностью заданным объектом распределения вероятностей, adtest
вычисляет adstat
использование заданных параметров.
Если гипотезированное распределение задано как семейство распределений с неизвестными параметрами, adtest
вычисляет adstat
использование параметров, оцененных из выборочных данных.
cv
- Критическое значениеКритическое значение для критерия Андерсона-Дарлинга на уровне значимости Alpha
, возвращается как скалярное значение. adtest
определяет cv
путем интерполяции в таблицу на основе заданных Alpha
уровень значимости.
Критерий Андерсона-Дарлинга обычно используется, чтобы проверить, получена ли выборка данных из нормального распределения. Однако его можно использовать для проверки другого гипотезированного распределения, даже если вы не полностью задаете параметры распределения. Вместо этого тест оценивает любые неизвестные параметры из выборки данных.
Тестовая статистика принадлежит к семейству квадратичных статистических данных эмпирических функций распределения, которые измеряют расстояние между гипотезированным распределением, F (x) и эмпирическим cdf, Fn (x) как
по упорядоченным выборкам значениям , где w (x) является весовой функцией, а n - количеством точек данных в выборке.
Весовая функция для критерия Андерсона-Дарлинга
который придает больший вес наблюдениям в хвостах распределения, таким образом делая тест более чувствительным к выбросам и лучше обнаруживает уход от нормальности в хвостах распределения.
Статистическая величина Критерия Андерсона-Дарлинга
где являются упорядоченными точками выборочных данных и n является количеством точек данных в выборке.
В adtest
решение отклонить или не отклонять нулевую гипотезу основано на сравнении p-значения для теста гипотезы с заданным уровнем значимости, а не на сравнении тестовой статистики с критическим значением.
Стандартная ошибка Монте-Карло является ошибкой из-за симуляции p -значение.
Стандартная ошибка Монте-Карло вычисляется как
где - предполагаемое p -значение теста гипотезы, и mcreps
количество выполненных репликаций Monte Carlo.
adtest
выбирает количество репликаций Monte Carlo, mcreps
, достаточно большой, чтобы сделать стандартную ошибку Монте-Карло для меньше значения, заданного для MCTol
.
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.