exponenta event banner

kstest2

Тест Колмогорова-Смирнова с двумя образцами

Описание

пример

h = kstest2(x1,x2) возвращает тестовое решение для нулевой гипотезы, что данные в векторах x1 и x2 из того же непрерывного распределения, используя тест Колмогорова-Смирнова с двумя образцами. Альтернативная гипотеза такова: x1 и x2 из различных непрерывных распределений. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне значимости 5%, и 0 в противном случае.

пример

h = kstest2(x1,x2,Name,Value) возвращает решение теста для теста Колмогорова-Смирнова из двух образцов с дополнительными опциями, заданными одним или несколькими аргументами пары имя-значение. Например, можно изменить уровень значимости или провести односторонний тест.

пример

[h,p] = kstest2(___) также возвращает асимптотическое значение p p, используя любой из входных аргументов из предыдущих синтаксисов.

пример

[h,p,ks2stat] = kstest2(___) также возвращает статистику теста ks2stat.

Примеры

свернуть все

Создайте образец данных из двух различных распределений Вейбулла.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Проверить нулевую гипотезу, что данные в векторах x1 и x2 происходит из популяций с одинаковым распределением.

h = kstest2(x1,x2)
h = logical
   1

Возвращенное значение h = 1 указывает, что kstest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Создайте образец данных из двух различных распределений Вейбулла.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Проверка нулевой гипотезы о том, что векторы данных x1 и x2 из групп населения с одинаковым распределением на уровне значимости 1%.

[h,p] = kstest2(x1,x2,'Alpha',0.01)
h = logical
   0

p = 0.0317

Возвращенное значение h = 0 указывает, что kstest не отвергает нулевую гипотезу на уровне значимости 1%.

Создайте образец данных из двух различных распределений Вейбулла.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Проверить нулевую гипотезу, что данные в векторах x1 и x2 происходит из популяций с одинаковым распределением, против альтернативной гипотезы, что cdf распределения x1 больше, чем cdf распределения x2.

[h,p,k] = kstest2(x1,x2,'Tail','larger')
h = logical
   1

p = 0.0158
k = 0.2800

Возвращенное значение h = 1 указывает, что kstest отвергает нулевую гипотезу в пользу альтернативной гипотезы о том, что cdf распределения x1 больше, чем cdf распределения x2, на уровне значимости по умолчанию 5%. Возвращенное значение k является тестовой статистикой для теста Колмогорова-Смирнова с двумя выборками.

Входные аргументы

свернуть все

Образец данных из первого образца, указанный как вектор. Векторы данных x1 и x2 не обязательно иметь одинаковый размер.

Типы данных: single | double

Выборка данных из второй выборки, указанная как вектор. Векторы данных x1 и x2 не обязательно иметь одинаковый размер.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Tail','larger','Alpha',0.01 определяет тест, используя альтернативную гипотезу, что эмпирический cdf x1 больше, чем эмпирический cdf x2, проводится на уровне значимости 1%.

Уровень значимости теста гипотезы, определяемый как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Тип альтернативной гипотезы для оценки, определяемый как разделенная запятыми пара, состоящая из 'Tail' и одно из следующих.

'unequal'Проверить альтернативную гипотезу, что эмпирический cdf x1 неравноценен эмпирическому cdf x2.
'larger'Проверить альтернативную гипотезу, что эмпирический cdf x1 больше, чем эмпирический cdf x2.
'smaller'Проверить альтернативную гипотезу, что эмпирический cdf x1 меньше, чем эмпирический cdf x2.

Если значения данных в x1 как правило, больше, чем в x2, эмпирическая функция распределения x1 имеет тенденцию быть меньше, чем у x2и наоборот.

Пример: 'Tail','larger'

Выходные аргументы

свернуть все

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

Асимптотическое p-значение теста, возвращаемое как скалярное значение в диапазоне (0,1). p - вероятность наблюдения проверочной статистики как экстремальной или более экстремальной, чем наблюдаемая величина при нулевой гипотезе. Асимптотическое значение p становится очень точным для больших размеров выборки и считается достаточно точным для размеров выборки. n1 и n2, такой, что (n1*n2)/(n1 + n2)4.

Статистика теста, возвращаемая как неотрицательное скалярное значение.

Подробнее

свернуть все

Тест Колмогорова-Смирнова с двумя образцами

Тест Колмогорова-Смирнова с двумя выборками является непараметрическим тестом гипотезы, который оценивает разницу между cdfs распределений двух векторов данных выборки в диапазоне x в каждом наборе данных.

Двусторонний тест использует максимальную абсолютную разницу между cdfs распределений двух векторов данных. Статистика теста:

D * = maxx (| F ^ 1 (x) F ^ 2 (x) |),

где F ^ 1 (x) - доля x1 значения, меньшие или равные x, и F ^ 2 (x) - доля x2 значения меньше или равны x.

Односторонний тест использует фактическое значение разности между cdfs распределений двух векторов данных, а не абсолютное значение. Статистика теста:

D * = maxx (F ^ 1 (x) F ^ 2 (x)).

Алгоритмы

В kstest2решение отклонить нулевую гипотезу основано на сравнении p-значения p с уровнем значимости Alpha, а не путем сравнения статистики теста ks2stat с критическим значением.

Ссылки

[1] Мэсси, Ф. Дж. «Тест Колмогорова-Смирнова на благость годности». Журнал Американской статистической ассоциации. т. 46, № 253, 1951, стр. 68-78.

[2] Миллер, Л.Х. «Таблица процентных пунктов статистики Колмогорова». Журнал Американской статистической ассоциации. Том 51, № 273, 1956, стр. 111-121.

[3] Марсалья, Г., В. Цанг и Дж. Ван. «Оценка распределения Колмогорова». Журнал статистического программного обеспечения. Том 8, выпуск 18, 2003.

См. также

| |

Представлен до R2006a