kstest2

Двухвыборочный критерий Колмогорова-Смирнова

Описание

пример

h = kstest2(x1,x2) возвращает решение теста для нулевой гипотезы о том, что данные в векторах x1 и x2 являются из того же непрерывного распределения, с использованием двухвыборочного критерия Колмогорова-Смирнова. Альтернативная гипотеза заключается в том, что x1 и x2 от различных непрерывных распределений. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне 5% значимости и 0 в противном случае.

пример

h = kstest2(x1,x2,Name,Value) возвращает решение теста для двухвыборочного критерия Колмогорова-Смирнова с дополнительными опциями, заданными одним или несколькими аргументы пары "имя-значение". Для примера можно изменить уровень значимости или провести односторонний тест.

пример

[h,p] = kstest2(___) также возвращает асимптотический p -value p, с использованием любого из входных параметров из предыдущих синтаксисов.

пример

[h,p,ks2stat] = kstest2(___) также возвращает тестовую статистику ks2stat.

Примеры

свернуть все

Сгенерируйте выборочные данные из двух различных распределений Вейбула.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Протестируйте нулевую гипотезу, что данные в векторах x1 и x2 происходит из населений с таким же распределением.

h = kstest2(x1,x2)
h = logical
   1

Возвращенное значение h = 1 указывает, что kstest отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Сгенерируйте выборочные данные из двух различных распределений Вейбула.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Проверьте нулевую гипотезу, что векторы данных x1 и x2 являются из населений с таким же распределением на уровне значимости 1%.

[h,p] = kstest2(x1,x2,'Alpha',0.01)
h = logical
   0

p = 0.0317

Возвращенное значение h = 0 указывает, что kstest не отклоняет нулевую гипотезу на уровне значимости 1%.

Сгенерируйте выборочные данные из двух различных распределений Вейбула.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Протестируйте нулевую гипотезу, что данные в векторах x1 и x2 происходит от населений с таким же распределением, против альтернативной гипотезы о том, что cdf распределения x1 больше, чем cdf распределения x2.

[h,p,k] = kstest2(x1,x2,'Tail','larger')
h = logical
   1

p = 0.0158
k = 0.2800

Возвращенное значение h = 1 указывает, что kstest отвергает нулевую гипотезу, в пользу альтернативной гипотезы о том, что cdf распределения x1 больше, чем cdf распределения x2, на уровне значимости 5% по умолчанию. Возвращенное значение k является тестовой статистикой для двухвыборочного критерия Колмогорова-Смирнова.

Входные параметры

свернуть все

Выборочные данные из первой выборки, заданная как вектор. Векторы данных x1 и x2 не обязательно иметь тот же размер.

Типы данных: single | double

Выборочные данные из второй выборки, заданная как вектор. Векторы данных x1 и x2 не обязательно иметь тот же размер.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Tail','larger','Alpha',0.01 задает тест, используя альтернативную гипотезу, что эмпирический cdf x1 больше, чем эмпирический cdf x2, проводимый на уровне 1% значимости.

Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Тип альтернативной гипотезы для оценки, заданный как разделенная разделенными запятой парами, состоящая из 'Tail' и одно из следующих.

'unequal'Протестируйте альтернативную гипотезу о том, что эмпирический cdf x1 не равен эмпирическому cdf x2.
'larger'Протестируйте альтернативную гипотезу о том, что эмпирический cdf x1 больше, чем эмпирический cdf x2.
'smaller'Протестируйте альтернативную гипотезу о том, что эмпирический cdf x1 меньше, чем эмпирический cdf x2.

Если значения данных в x1 как правило, больше, чем в x2, эмпирическая функция распределения x1 имеет тенденцию быть меньше, чем у x2, и наоборот.

Пример: 'Tail','larger'

Выходные аргументы

свернуть все

Результат теста гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

Асимптотическое p - значение теста, возвращаемое как скалярное значение в области значений (0,1). p - вероятность наблюдения тестовой статистики такой же экстремальной, как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. Асимптотическое значение p становится очень точным для больших размеров выборки и, как полагают, является достаточно точным для размеров выборки n1 и n2, таким образом (n1*n2)/(n1 + n2)4.

Тестовая статистика, возвращенная как неотрицательное скалярное значение.

Подробнее о

свернуть все

Двухвыборочный критерий Колмогорова-Смирнова

Двухвыборочный критерий Колмогорова-Смирнова является непараметрическим критерием гипотезы, который оценивает различие между cdfs распределений двух векторов выборочных данных в области значений x в каждом наборе данных.

Двухсторонний тест использует максимальное абсолютное различие между cdfs распределений двух векторов данных. Тестовая статистика

D*=maxx(|F^1(x)F^2(x)|),

где F^1(x) - доля x1 значений, меньших или равных x и F^2(x) - доля x2 значения, меньше или равные x.

Односторонний тест использует фактическое значение различия между cdfs распределений двух векторов данных, а не абсолютное значение. Тестовая статистика

D*=maxx(F^1(x)F^2(x)).

Алгоритмы

В kstest2решение отклонить нулевую гипотезу основано на сравнении p -value p с уровнем значимости Alpha, не путем сравнения тестовой статистической ks2stat с критическим значением.

Ссылки

[1] Мэсси, Ф. Дж. «Тест Колмогорова-Смирнова на качество подгонки». Журнал Американской статистической ассоциации. Том 46, № 253, 1951, с. 68-78.

[2] Миллер, Л. Х. «Таблица процентных точек колмогоровской статистики». Журнал Американской статистической ассоциации. Том 51, № 273, 1956, стр. 111-121.

[3] Marsaglia, G., W. Tsang, and J. Wang. «Оценка распределения Колмогорова». Журнал статистического программного обеспечения. Том 8, Выпуск 18, 2003.

См. также

| |

Представлено до R2006a