signrank

Wilcoxon подписал тест ранга

Описание

пример

p = signrank(x) возвращает p - значение двухстороннего Wilcoxon подписанный тест ранга.

signrank тестирует нулевую гипотезу что данные в векторном x произойдите из распределения, медиана которого является нулем на 5%-м уровне значения. Тест принимает что данные в x произойдите из непрерывного распределения, симметричного о его медиане.

пример

p = signrank(x,y) возвращает p - значение парного, двухстороннего теста для нулевой гипотезы что x Y прибывает из распределения с нулевой медианой.

p = signrank(x,y,Name,Value) возвращает p - значение для теста знака с дополнительными опциями, заданными одним или несколькими NameЗначение парные аргументы.

[p,h] = signrank(___) также возвращает логическое значение, указывающее на тестовое решение. h= 1 указывает на отклонение нулевой гипотезы и h= 0 указывает на отказ отклонить нулевую гипотезу на 5%-м уровне значения. Можно комбинировать с любым синтаксом из перечисленных выше.

пример

[p,h,stats] = signrank(___) также возвращает структуру stats с информацией о тестовой статистической величине.

пример

[___] = signrank(x,m) возвращает любой из выходных аргументов в предыдущих синтаксисах для нулевой гипотезы что данные в x наблюдения от распределения со средним m.

пример

[___] = signrank(x,m,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста ранга со знаком с дополнительными опциями, заданными одним или несколькими NameЗначение парные аргументы.

Примеры

свернуть все

Протестируйте гипотезу нулевой медианы.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

Протестируйте гипотезу что данные в x имеет нулевую медиану.

[p,h] = signrank(x)
p = 3.2229e-05
h = logical
   1

На 5%-м уровне значения по умолчанию, значение h = 1 указывает, что тест отклоняет нулевую гипотезу нулевой медианы.

Протестируйте гипотезу нулевой медианы для различия между парными выборками.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

Протестируйте гипотезу что x Y имеет нулевую медиану.

[p,h] = signrank(x,y)
p = 0.3223
h = logical
   0

Результаты показывают, что тесту не удается отклонить нулевую гипотезу нулевой медианы в различии на 5%-м уровне значения по умолчанию.

Проведите - примкнул тест на большой выборке с помощью приближения.

Загрузите выборочные данные.

load('gradespaired.mat');

Протестируйте нулевую гипотезу, что медиана различий в классе студентов до и после участия в программе обучения 0 против альтернативы, которой это меньше 0.

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')
p = 0.0047
h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

Поскольку объем выборки больше 15, signrank использует приближенный метод вычислить p- значение и также возвращает значение z- статистическая величина. Значение h = 1 указывает, что тест отклоняет нулевую гипотезу, что нет никакого различия между медианами класса на 5%-м уровне значения. Существует достаточно статистических данных, чтобы прийти к заключению, что средний класс перед программой обучения меньше среднего класса после программы обучения.

Повторите тест с помощью точного метода.

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')
p = 0.0045
h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

Полученное использование результатов приближенного метода сопоставимо с точным методом.

Загрузите выборочные данные.

load mileage

Данные содержат пробеги на галлон для трех различных типов автомобилей в столбцах 1 - 3.

Протестируйте гипотезу, что средний пробег для типа автомобилей во втором столбце отличается от 33.

[p,h,stats] = signrank(mileage(:,2),33)
p = 0.0313
h = logical
   1

stats = struct with fields:
    signedrank: 21

На 5%-м уровне значения результаты показывают, что средний пробег для второго типа автомобилей отличается от 33. Обратите внимание на то, что signrank использует точный метод, чтобы вычислить p- значение для небольших выборок и не возвращается z- статистическая величина.

Используйте аргументы пары "имя-значение" в signrank.

Загрузите выборочные данные.

load mileage

Данные содержат пробег на галлон для трех различных типов автомобилей в столбцах 1 - 3.

Протестируйте гипотезу, что средний пробег для типа автомобилей во второй строке больше, чем 33.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')
p = 0.0156
h = logical
   1

stats = struct with fields:
    signedrank: 21

Повторите тот же тест на 1%-м уровне значения с помощью приближенного метода.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')
p = 0.0180
h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

Этот результат, h = 0, указывает, что нулевая гипотеза не может быть отклонена на 1%-м уровне значения.

Входные параметры

свернуть все

Выборочные данные в виде вектора.

Типы данных: single | double

Выборочные данные в виде вектора. y должна быть та же длина как x.

Типы данных: single | double

Предполагавшееся значение медианы в виде скаляра.

Пример: signrank(x,10)

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'alpha',0.01,'method','approximate','tail','right' задает тест ранга со знаком с правильным хвостом с 1%-м уровнем значения, который возвращает аппроксимированное p-значение.

Уровень значения решения о гипотезе тестирует в виде разделенной запятой пары, состоящей из 'alpha' и скалярное значение в области значений от 0 до 1. Уровень значения h 100 * alpha%.

Пример: 'alpha', 0.01

Типы данных: double | single

Метод расчета pВ виде разделенной запятой пары, состоящей из 'method' и одно из следующих.

'exact'Точный расчет p - значение, p. Значение по умолчанию для 15 или меньшего количества наблюдений в xX M, или x Y когда method не задано.
'approximate'Нормальное приближение при вычислении p - значение, p. Значение по умолчанию больше чем для 15 наблюдений в xX M, или x Y когда 'method' не задано, потому что точный метод может быть медленным на больших выборках.

Пример: 'method', 'exact'

Тип теста в виде разделенной запятой пары, состоящей из 'tail' и одно из следующего:

'both'

Двухсторонний тест гипотезы, который является тестовым типом по умолчанию.

  • Для теста с одной выборкой альтернативная гипотеза утверждает что данные в x произойдите из непрерывного распределения с медианой, отличающейся, чем 0 или m.

  • Для 2D демонстрационного теста альтернативная гипотеза утверждает что данные в x Y произойдите из распределения с медианой, отличающейся, чем 0.

'right'

Тест гипотезы с правильным хвостом.

  • Для теста с одной выборкой альтернативная гипотеза утверждает что данные в x произойдите из непрерывного распределения с медианой, больше, чем 0 или m.

  • Для 2D демонстрационного теста альтернативная гипотеза утверждает данные в x Y произойдите из распределения с медианой, больше, чем 0.

'left'

Лево-хвостатый тест гипотезы.

  • Для теста с одной выборкой альтернативная гипотеза утверждает что данные в x произойдите из непрерывного распределения с медианой меньше чем 0 или m.

  • Для 2D демонстрационного теста альтернативная гипотеза утверждает данные в x Y произойдите из распределения с медианой меньше чем 0.

Пример: 'tail', 'left'

Выходные аргументы

свернуть все

p- теста, возвращенного как неотрицательный скаляр от 0 до 1. p вероятность наблюдения тестовой статистической величины как или более экстремальный, чем наблюдаемая величина по нулевой гипотезе. signrank вычисляет двухсторонний p - значение путем удвоения старшего значащего одностороннего значения.

Результат теста гипотезы, возвращенного как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы в 100 * alpha% уровень значения.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в 100 * alpha% уровень значения.

Протестируйте статистику, возвращенную как структура. Тестовая статистика сохранена в stats :

  • signrank: Значение ранга знака тестирует статистическую величину.

  • zval: Значение z - статистическая величина (вычисленный, когда 'method' 'approximate').

Больше о

свернуть все

Wilcoxon тест ранга со знаком

Подписанный тест ранга Wilcoxon является непараметрическим тестом для двух популяций, когда наблюдения соединяются. В этом случае тестовая статистическая величина, W, является суммой рангов положительных разниц между наблюдениями в этих двух выборках (то есть, x Y). Когда вы используете тест в одной выборке, затем W является суммой рангов положительных разниц между наблюдениями и предполагавшимся средним значением M 0 (который является 0, когда вы используете signrank(x) и m когда вы используете signrank(x,m)).

z-статистическая-величина

Для больших выборок, или когда method approximate, signrank функция вычисляет p - значение с помощью z - статистическая величина, данная

z=(Wn(n+1)/4)n(n+1)(2n+1)tieadj24,

где n является объемом выборки различия x – y или x M. Для 2D демонстрационного случая, signrank использование [tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff) получить значение корректировки связи tieadj.

Алгоритмы

signrank обработки NaNs в x и y как отсутствующие значения и игнорирует их.

Для 2D демонстрационного случая, signrank использует допуск на основе значений epsdiff = eps(x) + eps(y). signrank вычисляет абсолютные значения различий (abs(d(i)) где d(i) = x(i) – y(i)) и сравнивает их с epsdiff. Значения с абсолютным значением меньше, чем epsdiff (abs(d(i)) < epsdiff(i)) обработаны как связи.

Ссылки

[1] Гиббоны, J. D. и С. Какраборти. Непараметрический Статистический Вывод, 5-й Эд., Бока-Ратон, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M. и Д. А. Вольф. Непараметрические статистические методы. Хобокен, NJ: John Wiley & Sons, Inc., 1999.

Смотрите также

| | |

Представлено до R2006a