exponenta event banner

ranksum

Тест суммы рангов Вилкоксона

Описание

пример

p = ranksum(x,y) возвращает значение p двустороннего теста суммы рангов Вилкоксона. ranksum проверяет нулевую гипотезу, что данные в x и y являются выборками из непрерывных распределений с равными средами, против альтернативы, что они отсутствуют. Тест предполагает, что две выборки являются независимыми. x и y может иметь различную длину.

Этот тест эквивалентен U-тесту Манна-Уитни.

пример

[p,h] = ranksum(x,y) также возвращает логическое значение, указывающее решение теста. Результат h = 1 указывает на отклонение нулевой гипотезы, и h = 0 указывает на отказ отклонить нулевую гипотезу на уровне значимости 5%.

пример

[p,h,stats] = ranksum(x,y) также возвращает структуру stats с информацией о статистике теста.

пример

[___] = ranksum(x,y,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста суммы рангов с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.

Примеры

свернуть все

Проверить гипотезу о равных медианах для двух независимых образцов неравного размера.

Создать образец данных.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

Эти образцы получены из популяций с идентичными распределениями, за исключением смещения 0,25 в месте.

Проверка равенства медианов x и y.

p = ranksum(x,y)
p = 0.0375

Значение p 0,0375 указывает, что ranksum отвергает нулевую гипотезу о равных медианах на уровне значимости по умолчанию 5%.

Получить статистические данные теста на равенство двух медианов населения.

Загрузите образцы данных.

load mileage

Проверьте, является ли пробег на галлон одинаковым для первого и второго типов автомобилей.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))
p = 0.0043
h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

Как значение p, 0,043, так и h = 1 указывают на отклонение нулевой гипотезы равных медиан на уровне значимости по умолчанию 5%. Поскольку размеры выборки невелики (по шесть), ranksum вычисляет значение p точным методом. Структура stats включает в себя только значение статистики теста суммы рангов.

Проверить гипотезу об увеличении медианы населения.

Загрузите образцы данных.

load('weather.mat');

Данные погоды показывают суточные высокие температуры, принятые в одном и том же месяце в течение двух лет подряд.

Выполните левосторонний тест, чтобы оценить увеличение медианы на уровне значимости 1%.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')
p = 0.1271
h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

Как значение p 0,1271, так и h = 0 указывают на то, что нет достаточных доказательств, чтобы отвергнуть нулевую гипотезу и сделать вывод о положительном сдвиге медианы наблюдаемых высоких температур в том же месяце с 1 года на 2 год на уровне значимости 1%. Обратите внимание, что ranksum использует метод аппроксимации для вычисления значения p из-за больших размеров выборки.

Используйте точный метод для вычисления значения p.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')
p = 0.1273
h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

Результаты приблизительных и точных методов согласуются друг с другом.

Входные аргументы

свернуть все

Образец данных, указанный как вектор.

Типы данных: single | double

Образец данных, указанный как вектор. Длина y не обязательно должна совпадать с длиной x.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'alpha',0.01,'method','approximate','tail','right' задает правохвостый тест суммы рангов с уровнем значимости 1%, который возвращает аппроксимированное значение p.

Уровень значимости решения теста гипотезы, определяемый как разделенная запятыми пара, состоящая из 'alpha' и скалярное значение в диапазоне от 0 до 1. Уровень значимости h составляет 100 * alpha%.

Пример: 'alpha', 0.01

Типы данных: double | single

Метод вычисления значения p, p, указанная как пара, разделенная запятыми, состоящая из 'method' и одно из следующих:

'exact'Точное вычисление p-значения, p.
'approximate'Нормальная аппроксимация при вычислении p-значения, p.

Когда 'method' не указан, значение по умолчанию:

  • 'exact' если min (nx, ny) < 10 и nx + ny < 20

  • 'approximate' иначе

nx и ny - размеры образцов в x и yсоответственно.

Пример: 'method','exact'

Тип испытания, указанный как разделенная запятыми пара, состоящая из 'tail' и одно из следующих:

'both'Тест двусторонней гипотезы, где альтернативная гипотеза утверждает, что x и y имеют разные медианы. Тип теста по умолчанию, если 'tail' не указан.
'right'Правохвостый тест гипотезы, где альтернативная гипотеза утверждает, что медиана x больше медианы y.
'left'Левохвостый тест гипотезы, где альтернативная гипотеза утверждает, что медиана x меньше медианы y.

Пример: 'tail','left'

Выходные аргументы

свернуть все

p-значение теста, возвращаемое как положительный скаляр от 0 до 1. p - вероятность наблюдения проверочной статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. ranksum вычисляет двустороннее значение p путем удвоения наиболее значительного одностороннего значения.

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы при 100 * alpha% уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в 100 * alpha% уровень значимости.

Статистика тестирования, возвращенная в виде структуры. Статистика теста, сохраненная в stats являются:

  • ranksum Значение статистики теста суммирования рангов

  • zvalЗначение z-статистики (вычисляется, когда 'method' является 'approximate')

Подробнее

свернуть все

Тест Wilcoxon Rank Sum

Тест суммы рангов Уилкоксона является непараметрическим тестом для двух популяций, когда образцы независимы. Если X и Y независимые образцы с различными размерами выборки, статистика теста, которая ranksum возвращает ранговую сумму первой выборки.

Тест суммы рангов Уилкоксона эквивалентен U-тесту Манна-Уитни. U-тест Манна-Уитни является непараметрическим тестом на равенство популяционных медиан двух независимых выборок X и Y.

Статистика U-теста Манна-Уитни, U, - это число раз, когда y предшествует x в упорядоченном расположении элементов в двух независимых выборках. X и Y. Он связан со статистикой суммы рангов Уилкоксона следующим образом: X является выборкой размера nX, то

U = W nX (nX + 1) 2.

z-Статистика

Для больших образцов, ranksum использует z-статистику для вычисления приблизительного p-значения теста.

Если X и Y являются двумя независимыми выборками размера nX и nY, где nX < nY z-статистика

z = W E (W) V (W) = W [nXnY + nX (nX + 1) 2]−0.5∗sign (W E (W)) nXnY (nX + nY + 1) − tiescor12,

с коррекцией непрерывности и регулировкой связей. Здесь tiescor дается

tiescor=2∗tieadj (nX + nY) (nX + nY − 1),

где ranksum использование [ranks,tieadj] = tiedrank(x,y) для получения регулировок привязок. Стандартное нормальное распределение дает значение p для этой z-статистики.

Алгоритмы

ranksum удовольствия NaNs в x и y как отсутствующие значения и игнорирует их.

Для двустороннего теста медианов с неравными размерами выборки статистика теста показывает, что ranksum возвращает ранговую сумму первой выборки.

Ссылки

[1] Гиббонс, Дж. Д. и С. Чакраборти. Непараметрический статистический вывод, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вулф. Непараметрические статистические методы. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлен до R2006a