exponenta event banner

signrank

Ранговый тест с подписью Уилкоксона

Описание

пример

p = signrank(x) возвращает значение p двустороннего теста ранга с подписью Уилкоксона.

signrank проверяет нулевую гипотезу, что данные в векторе x происходит из распределения, медиана которого равна нулю на уровне значимости 5%. Тест предполагает, что данные в x происходят от непрерывного распределения, симметричного относительно его медианы.

пример

p = signrank(x,y) возвращает значение p парного двустороннего теста для нулевой гипотезы, что xy происходит от распределения с нулевой медианой.

p = signrank(x,y,Name,Value) возвращает значение p для теста знака с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.

[p,h] = signrank(___) также возвращает логическое значение, указывающее решение теста. h = 1 указывает на отклонение нулевой гипотезы, и h = 0 указывает на отказ отклонить нулевую гипотезу на уровне значимости 5%. Можно использовать любой из входных аргументов в предыдущих синтаксисах.

пример

[p,h,stats] = signrank(___) также возвращает структуру stats с информацией о статистике теста.

пример

[___] = signrank(x,m) возвращает любой из выходных аргументов в предыдущих синтаксисах для нулевой гипотезы, что данные в x - наблюдения из распределения с медианой m.

пример

[___] = signrank(x,m,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для подписанного рангового теста с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.

Примеры

свернуть все

Проверьте гипотезу о нулевой медиане.

Создайте образец данных.

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

Проверьте гипотезу о том, что данные в x имеет нулевую медиану.

[p,h] = signrank(x)
p = 3.2229e-05
h = logical
   1

На уровне значимости по умолчанию 5% значение h = 1 указывает, что тест отвергает нулевую гипотезу нулевой медианы.

Проверьте гипотезу о нулевой медиане для разницы между парными образцами.

Создайте образец данных.

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

Проверьте гипотезу, что xy имеет нулевую медиану.

[p,h] = signrank(x,y)
p = 0.3223
h = logical
   0

Результаты показывают, что тест не отклоняет нулевую гипотезу нулевой медианы в разнице на уровне значимости по умолчанию 5%.

С помощью аппроксимации проведите тест на большую выборку.

Загрузите образцы данных.

load('gradespaired.mat');

Проверьте нулевую гипотезу о том, что медиана различий в классах учащихся до и после участия в программе обучения равна 0, по сравнению с альтернативой, которая меньше 0.

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')
p = 0.0047
h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

Поскольку размер выборки больше 15, signrank использует приблизительный метод для вычисления p-значения, а также возвращает значение z-статистики. Стоимость h = 1 указывает на то, что тест отвергает нулевую гипотезу об отсутствии разницы между средами оценки на уровне значимости 5%. Существует достаточно статистических данных, чтобы сделать вывод о том, что средний балл до программы обучения меньше, чем средний балл после программы обучения.

Повторите тест точным способом.

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')
p = 0.0045
h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

Результаты, полученные с использованием приближенного метода, согласуются с точным методом.

Загрузите образцы данных.

load mileage

Данные содержат пробеги на галлон для трех различных типов автомобилей в столбцах 1- 3.

Проверить гипотезу о том, что медианный пробег для типа автомобилей во втором столбце отличается от 33.

[p,h,stats] = signrank(mileage(:,2),33)
p = 0.0313
h = logical
   1

stats = struct with fields:
    signedrank: 21

На уровне значимости 5% результаты показывают, что медианный пробег для второго типа автомобилей отличается от 33. Обратите внимание, что signrank использует точный метод для вычисления значения p для малых выборок и не возвращает z-статистику.

Используйте аргументы пары имя-значение в signrank.

Загрузите образцы данных.

load mileage

Данные содержат пробег на галлон для трех различных типов автомобилей в столбцах 1- 3.

Проверить гипотезу о том, что медианный пробег для типа автомобилей второго ряда больше 33.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')
p = 0.0156
h = logical
   1

stats = struct with fields:
    signedrank: 21

Повторите тот же тест на уровне значимости 1% с помощью приближенного метода.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')
p = 0.0180
h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

Этот результат, h = 0, указывает, что нулевая гипотеза не может быть отвергнута на уровне значимости 1%.

Входные аргументы

свернуть все

Образец данных, указанный как вектор.

Типы данных: single | double

Образец данных, указанный как вектор. y должна быть той же длины, что и x.

Типы данных: single | double

Гипотетическое значение медианы, определяемое как скаляр.

Пример: signrank(x,10)

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'alpha',0.01,'method','approximate','tail','right' задает правохвостый тест со знаком ранга с уровнем значимости 1%, который возвращает приблизительное значение p.

Уровень значимости решения теста гипотезы, определяемый как разделенная запятыми пара, состоящая из 'alpha' и скалярное значение в диапазоне от 0 до 1. Уровень значимости h составляет 100 * alpha%.

Пример: 'alpha', 0.01

Типы данных: double | single

Метод расчета p, указанная как пара, разделенная запятыми, состоящая из 'method' и одно из следующих.

'exact'Точное вычисление p-значения, p. Значение по умолчанию для 15 или менее наблюдений в x, xm, или xy когда method не указан.
'approximate'Нормальная аппроксимация при вычислении p-значения, p. Значение по умолчанию для более чем 15 наблюдений в x, xm, или xy когда 'method' не указан, поскольку точный метод может быть медленным на больших образцах.

Пример: 'method','exact'

Тип испытания, указанный как разделенная запятыми пара, состоящая из 'tail' и одно из следующих:

'both'

Двусторонний тест гипотез, который является типом теста по умолчанию.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения со средним значением, отличным от 0 или m.

  • Для теста с двумя выборками альтернативная гипотеза утверждает, что данные в xy происходит из распределения со средней, отличной от 0.

'right'

Правохвостый тест гипотезы.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой больше 0 или m.

  • Для теста с двумя выборками альтернативная гипотеза указывает данные в xy происходит из распределения с медианой больше 0.

'left'

Левохвостый тест гипотезы.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения со средним значением менее 0 или m.

  • Для теста с двумя выборками альтернативная гипотеза указывает данные в xy происходит из распределения со средним значением менее 0.

Пример: 'tail','left'

Выходные аргументы

свернуть все

p-значение теста, возвращаемое как неотрицательный скаляр от 0 до 1. p - вероятность наблюдения проверочной статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. signrank вычисляет двустороннее значение p путем удвоения наиболее значительного одностороннего значения.

Результат проверки гипотезы, возвращаемый как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы при 100 * alpha% уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в 100 * alpha% уровень значимости.

Статистика тестирования, возвращенная в виде структуры. Статистика теста, сохраненная в stats являются:

  • signrankЗначение статистики проверки ранга знака.

  • zvalЗначение статистики z- (вычисляется, когда 'method' является 'approximate').

Подробнее

свернуть все

Подписанный ранговый тест Wilcoxon

Тест Wilcoxon со знаком ранга является непараметрическим тестом для двух популяций, когда наблюдения парные. В этом случае статистика теста, W, представляет собой сумму рангов положительных различий между наблюдениями в двух выборках (то есть xy). Когда вы используете тест для одной выборки, то W - это сумма рангов положительных различий между наблюдениями и предполагаемым средним значением M0 (которое равно 0 при использовании signrank(x) и m при использовании signrank(x,m)).

z-Статистика

Для больших образцов или когда method является approximate, signrank функция вычисляет значение p, используя z-статистику, заданную

z = (W n (n + 1 )/4) n (n + 1) (2n + 1) − tieadj24,

где n - размер выборки разности x – y или xm. Для случая с двумя образцами: signrank использование [tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff) для получения значения регулировки привязки tieadj.

Алгоритмы

signrank удовольствия NaNs в x и y как отсутствующие значения и игнорирует их.

Для случая с двумя образцами: signrank использует допуск на основе значений epsdiff = eps(x) + eps(y). signrank вычисляет абсолютные значения разностей (abs(d(i)) где d(i) = x(i) – y(i)) и сравнивает их с epsdiff. Значения с абсолютным значением меньше epsdiff (abs(d(i)) < epsdiff(i)) рассматриваются как связи.

Ссылки

[1] Гиббонс, Дж. Д. и С. Чакраборти. Непараметрический статистический вывод, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вулф. Непараметрические статистические методы. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлен до R2006a