Тест Андерсона-Дарлинга
возвращает тестовое решение для нулевой гипотезы, что данные в векторе h = adtest(x)x из популяции с нормальным распределением, используя тест Андерсона-Дарлинга. Альтернативная гипотеза такова: x не из населения с нормальным распределением. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне значимости 5%, или 0 в противном случае.
возвращает решение теста Андерсона-Дарлинга с дополнительными опциями, заданными одним или несколькими аргументами пары имя-значение. Например, можно указать распределение NULL, отличное от обычного, или выбрать альтернативный метод вычисления значения p.h = adtest(x,Name,Value)
Загрузите образцы данных. Создайте вектор, содержащий первый столбец данных оценок ЕГЭ учащихся.
load examgrades
x = grades(:,1);Проверьте нулевую гипотезу о том, что оценки ЕГЭ происходят из нормального распределения. Нет необходимости указывать значения параметров заполнения.
[h,p,adstat,cv] = adtest(x)
h = logical
0
p = 0.1854
adstat = 0.5194
cv = 0.7470
Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
Загрузите образцы данных. Создайте вектор, содержащий первый столбец данных оценок ЕГЭ учащихся.
load examgrades
x = grades(:,1);Проверьте нулевую гипотезу о том, что оценки ЕГЭ происходят от крайнего распределения значений. Нет необходимости указывать значения параметров заполнения.
[h,p] = adtest(x,'Distribution','ev')
h = logical
0
p = 0.0714
Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
Загрузите образцы данных. Создайте вектор, содержащий первый столбец данных оценок ЕГЭ учащихся.
load examgrades
x = grades(:,1);Создание нормального объекта распределения вероятностей со средним значением mu = 75 и стандартное отклонение sigma = 10.
dist = makedist('normal','mu',75,'sigma',10)
dist =
NormalDistribution
Normal distribution
mu = 75
sigma = 10
Проверьте нулевую гипотезу, что x происходит из гипотетического нормального распределения.
[h,p] = adtest(x,'Distribution',dist)h = logical
0
p = 0.4687
Возвращенное значение h = 0 указывает, что adtest не может отклонить нулевую гипотезу на уровне значимости по умолчанию 5%.
x - Образцы данныхОбразец данных, указанный как вектор. Отсутствующие наблюдения в x, обозначается NaN, игнорируются.
Типы данных: single | double
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
'Alpha',0.01,'MCTol',0.01 проводит тест гипотезы на уровне значимости 1% и определяет значение p, p, используя моделирование Монте-Карло с максимальной стандартной ошибкой Монте-Карло для p 0,01.'Distribution' - Гипотетическое распределение'norm' (по умолчанию) | 'exp' | 'ev' | 'logn' | 'weibull' | объект распределения вероятностейПредполагаемое распределение вектора данных x, указанная как пара, разделенная запятыми, состоящая из 'Distribution' и одно из следующих.
'norm' | Нормальное распределение |
'exp' | Экспоненциальное распределение |
'ev' | Распределение экстремальных значений |
'logn' | Логнормальное распределение |
'weibull' | Распределение Вейбулла |
В этом случае нет необходимости задавать параметры заполнения. Вместо этого adtest оценивает параметры распределения на основе данных выборки и тестов x против композитной гипотезы, что она исходит из выбранного семейства распределения с неуказанными параметрами.
Можно также указать любой объект непрерывного распределения вероятностей для нулевого распределения. В этом случае необходимо указать все параметры распределения, и adtest тесты x против простой гипотезы, что она исходит из данного распределения с заданными им параметрами.
Пример: 'Distribution','exp'
'Alpha' - Уровень значимости0.05 (по умолчанию) | скалярное значение в диапазоне (0,1)Уровень значимости теста гипотезы, определяемый как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1).
Пример: 'Alpha',0.01
Типы данных: single | double
'MCTol' - Максимальная стандартная ошибка Монте-КарлоМаксимальная стандартная ошибка Монте-Карло для значения p, p, указанная как пара, разделенная запятыми, состоящая из 'MCTol' и положительное скалярное значение. Если вы используете MCTol, adtest определяет p с использованием моделирования Монте-Карло и аргумента пары имя-значение Asymptotic должно иметь значение false.
Пример: 'MCTol',0.01
Типы данных: single | double
'Asymptotic' - Метод вычисления p-значенияfalse (по умолчанию) | trueМетод вычисления значения p теста Андерсона-Дарлинга, указанного как пара, разделенная запятыми, состоящая из 'Asymptotic' и либо true или false. При указании 'true', adtest оценивает значение p, используя ограничивающее распределение статистики теста Андерсона-Дарлинга. При указании false, adtest вычисляет значение p на основе аналитической формулы. Для размеров выборки, превышающих 120, предельная оценка распределения, вероятно, будет более точной, чем метод аппроксимации малого размера выборки.
Если указано семейство распределения с неизвестными параметрами для Distribution пара имя-значение, Asymptotic должно быть false.
Если вы используете MCTol для вычисления значения p с помощью моделирования Монте-Карло, Asymptotic должно быть false.
Пример: 'Asymptotic',true
Типы данных: logical
h - Результат проверки гипотезы1 | 0Результат проверки гипотезы, возвращенный как логическое значение.
Если h
= 1, это указывает на отклонение нулевой гипотезы в Alpha уровень значимости.
Если h
= 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.
p - p-значениеp-значение теста Андерсона-Дарлинга, возвращаемое как скалярное значение в диапазоне [0,1]. p - вероятность наблюдения проверочной статистики как экстремальной или более экстремальной, чем наблюдаемая величина при нулевой гипотезе. p вычисляется одним из следующих методов:
Если предполагаемое распределение является полностью заданным объектом распределения вероятности, adtest вычисляет p аналитически. Если 'Asymptotic' является true, adtest использует асимптотическое распределение тестовой статистики. Если указано значение для 'MCTol', adtest использует моделирование Монте-Карло.
Если предполагаемое распределение указано как семейство распределения с неизвестными параметрами, adtest извлекает критическое значение из таблицы и использует обратную интерполяцию для определения p-значения. Если указано значение для 'MCTol', adtest использует моделирование Монте-Карло.
adstat - Статистика испытанийСтатистика теста Андерсона-Дарлинга, возвращенная как скалярное значение.
Если предполагаемое распределение является полностью заданным объектом распределения вероятности, adtest вычисляет adstat с использованием заданных параметров.
Если предполагаемое распределение указано как семейство распределения с неизвестными параметрами, adtest вычисляет adstat используя параметры, оцененные по данным выборки.
cv - Критическое значениеКритическое значение для теста Андерсона-Дарлинга на уровне значимости Alpha, возвращается как скалярное значение. adtest определяет cv путем интерполяции в таблицу на основе указанного Alpha уровень значимости.
Тест Андерсона-Дарлинга обычно используется для проверки того, происходит ли выборка данных из нормального распределения. Однако его можно использовать для проверки другого гипотетического распределения, даже если параметры распределения указаны не полностью. Вместо этого тест оценивает любые неизвестные параметры из выборки данных.
Проверочная статистика относится к семейству квадратичных эмпирических статистических функций распределения, которые измеряют расстояние между гипотетическим распределением, F (x) и эмпирическим cdf, Fn (x) как
) dF (x),
над упорядоченными значениями выборки < xn, где w (x) - функция веса, а n - количество точек данных в выборке.
Функция веса для теста Андерсона-Дарлинга
(x))] − 1,
который придает больший вес наблюдениям в хвостах распределения, тем самым делая тест более чувствительным к отклонениям и лучше обнаруживая отход от нормальности в хвостах распределения.
Статистика теста Андерсона-Дарлинга
+ 1 − i))],
где Xn} - упорядоченные точки данных выборки, а n - количество точек данных в выборке.
В adtestрешение отклонить или не отклонить нулевую гипотезу основано на сравнении p-значения для теста гипотезы с заданным уровнем значимости, а не на сравнении тестовой статистики с критическим значением.
Стандартная ошибка Монте-Карло - это ошибка, вызванная моделированием значения p.
Стандартная ошибка Монте-Карло рассчитывается как
mcreps,
где ^ - оценочное значение p теста гипотезы, иmcreps - количество выполненных репликаций Монте-Карло.
adtest выбирает количество повторений Монте-Карло, mcreps, достаточно большой, чтобы сделать стандартную ошибку Монте-Карло для ^ меньше значения, указанного дляMCTol.
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.