ranksum

Критерий суммы ранга Уилкоксона

Описание

пример

p = ranksum(x,y) возвращает p -значение двустороннего ранга суммы Уилкоксона. ranksum проверяет нулевую гипотезу, что данные в x и y являются выборками из непрерывных распределений с равными медианами, против альтернативы, которую они не имеют. Тест принимает, что эти две выборки независимы. x и y может иметь разную длину.

Этот тест эквивалентен U-тесту Манна-Уитни.

пример

[p,h] = ranksum(x,y) также возвращает логическое значение, указывающее на решение теста. Результат h = 1 указывает на отказ от нулевой гипотезы, и h = 0 указывает, что отказ отклонить гипотезу null на уровне 5% значимости.

пример

[p,h,stats] = ranksum(x,y) также возвращает структуру stats с информацией о тестовой статистике.

пример

[___] = ranksum(x,y,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста ранговой суммы с дополнительными опциями, заданными одной или несколькими Name, Value аргументы в виде пар.

Примеры

свернуть все

Проверьте гипотезу о равных медианах для двух независимых выборок неравного размера.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

Эти выборки получены из населений с идентичными распределениями, за исключением сдвига 0,25 в местоположении.

Проверяйте равенство медиан x и y.

p = ranksum(x,y)
p = 0.0375

p-значение 0.0375 указывает, что ranksum отклоняет нулевую гипотезу о равных медианах на уровне значимости по умолчанию 5%.

Получите статистику теста на равенство двух медиан населения.

Загрузите выборочные данные.

load mileage

Проверьте, является ли пробег на галлон одинаковым для первого и второго типа автомобилей.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))
p = 0.0043
h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

Оба p-значение, 0,043 и h = 1 указывают на отказ от нулевой гипотезы о равных медианах на уровне значимости по умолчанию 5%. Поскольку размеры выборки малы (по шесть), ranksum вычисляет p-значение с использованием точного метода. Структура stats включает только значение тестовой статистики ранговой суммы.

Протестируйте гипотезу об увеличении населения.

Загрузите выборочные данные.

load('weather.mat');

Данные о погоде показывают ежедневные высокие температуры, взятые в том же месяце за два последовательных года.

Выполните левый тест, чтобы оценить увеличение медианы на уровне значимости 1%.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')
p = 0.1271
h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

Оба p- значение 0,1271 и h = 0 указывают, что недостаточно доказательств, чтобы отклонить нулевую гипотезу и сделать вывод, что наблюдается положительный сдвиг медианы наблюдаемых высоких температур в том же месяце от 1 года до 2 года на уровне значимости 1%. Заметьте, что ranksum использует приблизительный метод, чтобы вычислить p-значение из-за больших размеров образца.

Используйте точный метод, чтобы вычислить p-значение.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')
p = 0.1273
h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

Результаты приблизительных и точных методов согласуются друг с другом.

Входные параметры

свернуть все

Выборочные данные, заданная как вектор.

Типы данных: single | double

Выборочные данные, заданная как вектор. Длина y не обязательно совпадать с длиной x.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'alpha',0.01,'method','approximate','tail','right' задает критерий правой ранговой суммы с уровнем значимости 1%, который возвращает приблизительное p-значение.

Уровень значимости решения проверки гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'alpha' и скалярное значение в области значений от 0 до 1. Уровень значимости h равен 100 * alpha%.

Пример: 'alpha', 0.01

Типы данных: double | single

Метод расчета p -значение, p, заданная как разделенная разделенными запятой парами, состоящая из 'method' и одно из следующих:

'exact'Точный расчет p -значение, p.
'approximate'Нормальное приближение при вычислении p -значение, p.

Когда 'method' не задан, значение по умолчанию является:

  • 'exact' если min (nx, ny) < 10 и nx + ny < 20

  • 'approximate' иначе

nx и ny являются размерами выборок в x и y, соответственно.

Пример: 'method', 'exact'

Тип теста, заданный как разделенная разделенными запятой парами, состоящая из 'tail' и одно из следующих:

'both'Двусторонний тест гипотезы, где альтернативная гипотеза утверждает, что x и y имеют разные медианы. Тип теста по умолчанию, если 'tail' не задан.
'right'Критерий правохвостой гипотезы, где альтернативная гипотеза утверждает, что медиана x больше медианы y.
'left'Критерий левохвостой гипотезы, где альтернативная гипотеза утверждает, что медиана x меньше медианы y.

Пример: 'tail', 'left'

Выходные аргументы

свернуть все

p значение теста, возвращенное как положительный скаляр от 0 до 1. p - вероятность наблюдения тестовой статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. ranksum вычисляет двустороннее p -value путем удвоения наиболее значимого одностороннего значения.

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в alpha 100 *% уровня значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в alpha 100 *% уровня значимости.

Тестовая статистика, возвращенная как структура. Тестовая статистика сохранена в stats являются:

  • ranksum : Значение ранга статистики теста суммы

  • zval: Значение z-статистики (вычисляется при 'method' является 'approximate')

Подробнее о

свернуть все

Суммарный тест Ранг

Ранг sum является непараметрическим тестом для двух населений, когда выборки независимы. Если X и Y являются независимыми выборками с различными размерами выборки, статистика теста, которая ranksum возвраты - ранговая сумма первой выборки.

Суммарный тест ранга Уилкоксона эквивалентен U-критерию Манна-Уитни. U-критерий Манна-Уитни является непараметрическим тестом на равенство населений двух независимых выборок X и Y.

Статистика U-теста Манна-Уитни, U, является количеством раз в y, предшествующим x в упорядоченном расположении элементов в двух независимых выборках X и Y. Он связан со статистикой ранга Уилкоксона следующим образом: Если X является выборкой размера nX, тогда

U=WnX(nX+1)2.

z-Statistic

Для больших выборок, ranksum использует z -statistic, чтобы вычислить приблизительное p -значение теста.

Если X и Y являются двумя независимыми выборками размера nX и nY, где nX < nY z -statistic is

z=WE(W)V(W)=W[nXnY+nX(nX+1)2]0.5sign(WE(W))nXnY(nX+nY+1)tiescor12,

с коррекцией непрерывности и регулировкой завязки. Здесь tiescor задается как

tiescor=2tieadj(nX+nY)(nX+nY1),

где ranksum использует [ranks,tieadj] = tiedrank(x,y) для получения регулировки галстука. Стандартное нормальное распределение придает p -value для этого z -statistic.

Алгоритмы

ranksum лечит NaNs в x и y как отсутствующие значения и игнорирует их.

Для двустороннего теста медиан с неравными размерами выборки, тестовая статистика, которая ranksum возвраты - ранговая сумма первой выборки.

Ссылки

[1] Гиббонс, Дж. Д., и С. Чакраборти. Непараметрический статистический вывод, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вульф. Непараметрические статистические методы. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлено до R2006a