signrank

Тест на ранг, подписанный Уилкоксоном

Описание

пример

p = signrank(x) возвращает p -значение двустороннего рангового теста Уилкоксона со знаком.

signrank проверяет нулевую гипотезу, что данные в векторе x происходит из распределения, медиана которого равна нулю на уровне 5% значимости. Тест принимает, что данные в x происходит от непрерывного распределения, симметричного относительно его медианы.

пример

p = signrank(x,y) возвращает p -значение парного двустороннего теста для нулевой гипотезы, которая xy происходит из распределения с нулевой медианой.

p = signrank(x,y,Name,Value) возвращает p -value для знакового теста с дополнительными опциями, заданными одним или несколькими Name, Value аргументы в виде пар.

[p,h] = signrank(___) также возвращает логическое значение, указывающее на решение теста. h = 1 указывает на отказ от нулевой гипотезы, и h = 0 указывает, что отказ отклонить гипотезу null на уровне 5% значимости. Можно использовать любой из входных параметров в предыдущих синтаксисах.

пример

[p,h,stats] = signrank(___) также возвращает структуру stats с информацией о тестовой статистике.

пример

[___] = signrank(x,m) возвращает любой из выходных аргументов в предыдущих синтаксисах для нулевой гипотезы, в которой находятся данные x являются наблюдениями из распределения с медианной m.

пример

[___] = signrank(x,m,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста ранга со знаком с дополнительными опциями, заданными одной или несколькими Name, Value аргументы в виде пар.

Примеры

свернуть все

Проверьте гипотезу о нулевой медиане.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

Проверьте гипотезу о том, что данные в x имеет нулевую медиану.

[p,h] = signrank(x)
p = 3.2229e-05
h = logical
   1

На уровне значимости 5% по умолчанию значение h = 1 указывает, что тест отклоняет нулевую гипотезу нулевой медианы.

Проверьте гипотезу нулевой медианы на различие между парными выборками.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

Проверяйте гипотезу, что xy имеет нулевую медиану.

[p,h] = signrank(x,y)
p = 0.3223
h = logical
   0

Результаты показывают, что тест не может отклонить нулевую гипотезу о нуль медиане в различие на уровне значимости по умолчанию 5%.

Проведите сторонний тест на большой выборке с помощью приближения.

Загрузите выборочные данные.

load('gradespaired.mat');

Проверьте нулевую гипотезу о том, что медиана различий классов учащихся до и после участия в программе репетитора равна 0 против альтернативы, что она меньше 0.

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')
p = 0.0047
h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

Поскольку размер выборки больше 15, signrank использует приблизительный метод, чтобы вычислить p-value, а также возвращает значение z-статистический. Значение h = 1 указывает, что тест отклоняет нулевую гипотезу об отсутствии различий между медианами оценки на уровне 5% значимости. Существует достаточно статистических данных, чтобы сделать вывод, что медианная оценка перед программой репетиторства меньше, чем медианная оценка после программы репетиторства.

Повторите тест с помощью точного метода.

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')
p = 0.0045
h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

Результаты, полученные с использованием приблизительного метода, согласуются с точным методом.

Загрузите выборочные данные.

load mileage

Данные содержат пробеги на галлон для трех различных типов автомобилей в столбцах с 1 по 3.

Проверьте гипотезу о том, что медианный пробег для типа автомобилей во втором столбце отличается от 33.

[p,h,stats] = signrank(mileage(:,2),33)
p = 0.0313
h = logical
   1

stats = struct with fields:
    signedrank: 21

При уровне значимости 5% результаты показывают, что медианный пробег для второго типа автомобилей отличается от 33. Обратите внимание, что signrank использует точный метод, чтобы вычислить p-значение для небольших выборок и не возвращает z-статистический.

Используйте аргументы пары "имя-значение" в signrank.

Загрузите выборочные данные.

load mileage

Данные содержат пробег на галлон для трех различных типов автомобилей в столбцах с 1 по 3.

Проверьте гипотезу о том, что медианный пробег для типа автомобилей во второй строке больше 33.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')
p = 0.0156
h = logical
   1

stats = struct with fields:
    signedrank: 21

Повторите тот же тест на уровне значимости 1% с помощью приблизительного метода.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')
p = 0.0180
h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

Этот результат, h = 0, указывает, что нулевая гипотеза не может быть отклонена на уровне значимости 1%.

Входные параметры

свернуть все

Выборочные данные, заданная как вектор.

Типы данных: single | double

Выборочные данные, заданная как вектор. y должна быть такой же длины, как и x.

Типы данных: single | double

Гипотезированное значение медианы, заданное как скаляр.

Пример: signrank(x,10)

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'alpha',0.01,'method','approximate','tail','right' задает критерий ранга со знаком справа с уровнем значимости 1%, который возвращает приблизительное значение p.

Уровень значимости решения проверки гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'alpha' и скалярное значение в области значений от 0 до 1. Уровень значимости h равен 100 * alpha%.

Пример: 'alpha', 0.01

Типы данных: double | single

Расчет p, заданная как разделенная разделенными запятой парами, состоящая из 'method' и одно из следующих.

'exact'Точный расчет p -значение, p. Значение по умолчанию для 15 или менее наблюдений в x, xm, или xy когда method не задан.
'approximate'Нормальное приближение при вычислении p -значение, p. Значение по умолчанию для более чем 15 наблюдений в x, xm, или xy когда 'method' не задан, потому что точный метод может быть медленным на больших выборках.

Пример: 'method', 'exact'

Тип теста, заданный как разделенная разделенными запятой парами, состоящая из 'tail' и одно из следующих:

'both'

Двусторонний тест гипотезы, который является типом теста по умолчанию.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой, отличной от 0 или m.

  • Для теста с двумя выборками альтернативная гипотеза утверждает, что данные в xy происходит из распределения с медианой, отличной от 0.

'right'

Критерий правохвостой гипотезы.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой, большей 0 или m.

  • Для двухвыборочного теста альтернативная гипотеза утверждает данные в xy происходит из распределения с медианой, большей 0.

'left'

Критерий левохвостой гипотезы.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой менее 0 или m.

  • Для двухвыборочного теста альтернативная гипотеза утверждает данные в xy происходит из распределения с медианой менее 0.

Пример: 'tail', 'left'

Выходные аргументы

свернуть все

p значение теста, возвращенное как неотрицательный скаляр от 0 до 1. p - вероятность наблюдения тестовой статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. signrank вычисляет двустороннее p -value путем удвоения наиболее значимого одностороннего значения.

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отказ от нулевой гипотезы при 100 * alpha% уровня значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в alpha 100 *% уровня значимости.

Тестовая статистика, возвращенная как структура. Тестовая статистика сохранена в stats являются:

  • signrank: Значение тестовой статистики ранга знака.

  • zval: Значение z - статистическое (вычисляется при 'method' является 'approximate').

Подробнее о

свернуть все

Тест Wilcoxon Signed Rank

Критерий ранга Уилкоксона со знаком является непараметрическим тестом для двух населений, когда наблюдения спариваются. В этом случае тестовая статистика W является суммой рангов положительных различий между наблюдениями в двух выборках (то есть xy). Когда вы используете тест для одной выборки, тогда W - это сумма рангов положительных различий между наблюдениями и гипотезированным медианным значением M 0 (что 0 при использовании signrank(x) и m когда вы используете signrank(x,m)).

z-Statistic

Для больших выборок, или когда method является approximate, а signrank функция вычисляет p -значение, используя z -statistic, заданную как

z=(Wn(n+1)/4)n(n+1)(2n+1)tieadj24,

где n - размер выборки различия x – y или xm. Для примера с двумя образцами signrank использует [tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff) для получения значения регулировки галстука tieadj.

Алгоритмы

signrank лечит NaNs в x и y как отсутствующие значения и игнорирует их.

Для примера с двумя образцами, signrank использует допуск на основе значений epsdiff = eps(x) + eps(y). signrank вычисляет абсолютные значения различий (abs(d(i)) где d(i) = x(i) – y(i)) и сравнивает их с epsdiff. Значения с абсолютным значением меньше epsdiff (abs(d(i)) < epsdiff(i)) рассматриваются как связи.

Ссылки

[1] Гиббонс, Дж. Д., и С. Чакраборти. Непараметрический статистический вывод, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вульф. Непараметрические статистические методы. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлено до R2006a