exponenta event banner

signtest

Описание

пример

p = signtest(x) возвращает значение p для двустороннего теста знака.

signtest проверяет гипотезу, что данные в x имеет непрерывное распределение с нулевой медианой по сравнению с альтернативой, в которой распределение не имеет нулевой медианы на уровне значимости 5%.

пример

p = signtest(x,y) возвращает значение p двустороннего теста знака. Здесь,signtest проверяет гипотезу о том, что данные в xy имеет распределение с нулевой медианой по сравнению с альтернативой, в которой распределение не имеет нулевой медианы. Обратите внимание, что гипотеза нулевой медианы для xy не эквивалентно гипотезе о равной медиане для x и y.

пример

p = signtest(x,y,Name,Value) возвращает значение p для теста знака с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.

[p,h] = signtest(___) также возвращает логическое значение, указывающее решение теста. Стоимость h = 1 указывает на отклонение нулевой гипотезы, и h = 0 указывает на отказ отклонить нулевую гипотезу на уровне значимости 5%. Можно использовать любой из входных аргументов в предыдущих синтаксисах.

пример

[p,h,stats] = signtest(___) также возвращает структуру stats содержит информацию о статистике теста.

пример

[___] = signtest(x,m) возвращает любой из выходных аргументов в предыдущих синтаксисах для проверки наличия данных в x - наблюдения из распределения с медианой m против альтернативы, в которой медиана отличается от m.

пример

[___] = signtest(x,m,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для проверки знака с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.

Примеры

свернуть все

Проверьте гипотезу о нулевой медиане.

Создайте образец данных.

rng('default') % for reproducibility
x = randn(1,25);

Распределение выборки x симметричен с нулевой медианой.

Проверьте нулевую гипотезу, что x происходит от распределения с медианой, отличной от нулевой медианы.

[p,h,stats] = signtest(x,0)
p = 0.1078
h = logical
   0

stats = struct with fields:
    zval: NaN
    sign: 17

На уровне значимости по умолчанию 5% результат h = 0 означает, что signtest не может отклонить нулевую гипотезу нулевой медианы. signtest вычисляет значение p точным методом, поэтому не вычисляет zval и возвращает его как NaN.

Проверьте гипотезу о нулевой медиане для разницы между парными образцами.

Создайте образец данных.

rng('default') % for reproducibility
before = lognrnd(2,.25,10,1);
after = before + (lognrnd(0,.5,10,1) - 1);

Распределение выборки разницы между before и after симметричен с нулевой медианой.

Проверить нулевую гипотезу, что разница before и after имеет нулевую медиану.

[p,h] = signtest(before,after)
p = 0.7539
h = logical
   0

На уровне значимости по умолчанию 5% значение h = 0 означает, что signtest не может отклонить нулевую гипотезу нулевой медианы в разнице.

Проверьте гипотезу о нулевой медиане для разницы между двумя парными выборками, используя точный и приблизительный методы.

Создайте образец данных.

rng('default') % for reproducibility
x = lognrnd(2,.25,15,1);
y = x + trnd(2,15,1);
display([x y])
    8.4521    7.8047
   11.6869   11.4094
    4.2009    5.1133
    9.1664   12.1655
    8.0020   10.0300
    5.3285    6.0153
    6.6300    5.1235
    8.0499    8.6737
   18.0763   19.2164
   14.7665   15.3380
    5.2726    8.4187
   15.7798   16.2093
    8.8583    8.5575
    7.2735    7.4783
    8.8347    7.8894

Проверьте гипотезу, что xy имеет нулевую медиану.

[p,h,stats] = signtest(x,y)
p = 0.3018
h = logical
   0

stats = struct with fields:
    zval: NaN
    sign: 5

На уровне значимости по умолчанию 5% значение h = 0 указывает, что тест не отклоняет нулевую гипотезу нулевой медианы в разнице.

Повторите тест, используя приблизительный метод.

[p,h,stats] = signtest(x,y,'Method','approximate')
p = 0.3017
h = logical
   0

stats = struct with fields:
    zval: -1.0328
    sign: 5

Приблизительное p-значение, которое signtest получает, используя z-статистику, действительно близок к точному p-значению.

Выполните левосторонний тест знака для больших образцов.

Загрузите образцы данных.

load gradespaired

Проверьте нулевую гипотезу о том, что медиана различий оценок до и после программы обучения равна 0, против альтернативной, что она меньше 0.

[p,h,stats] = signtest(gradespaired(:,1),gradespaired(:,2),'Tail','left')
p = 0.0013
h = logical
   1

stats = struct with fields:
    zval: -3.0110
    sign: 37

Поскольку размер выборки велик (больше 100), signtest использует приблизительный метод для вычисления p-значения, а также возвращает значение z-статистики. Тест отвергает нулевую гипотезу об отсутствии разницы между средами оценки на уровне значимости 5%.

Проверьте гипотезу о том, что медиана населения отличается от заданного значения.

Загрузите образцы данных.

load lawdata

Набор данных содержит 15 наблюдений за переменными gpa и lsat.

Проверить гипотезу, что медиана lsat балл выше 570.

[p,h,stats] = signtest(lsat,570,'Tail','right')
p = 0.0176
h = logical
   1

stats = struct with fields:
    zval: NaN
    sign: 12

Как значение p, 0,0176, так и h = 1 указывают на то, что на уровне значимости 5% тест завершается в пользу альтернативной гипотезы.

Входные аргументы

свернуть все

Образец данных, указанный как вектор.

Типы данных: single | double

Образец данных, указанный как вектор. y должна быть той же длины, что и x.

Типы данных: single | double

Гипотетическое значение медианы, определяемое как скаляр.

Пример: signtest(x,35)

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'Method','approximate','Tail','right' задает правохвостый тест знака с уровнем значимости 1%, который возвращает приблизительное значение p.

Уровень значимости теста гипотезы, определяемый как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне от 0 до 1. Значение по умолчанию Alpha составляет 0,05. Уровень значимости h составляет 100 * Alpha%.

Пример: 'Alpha', 0.01

Типы данных: double | single

метод вычисления p-значения, указанный как разделенная запятыми пара, состоящая из 'Method' и одно из следующих:

'exact'Точное вычисление p-значения, p.
'approximate'Нормальное приближение для вычисления p-значения, p.

Метод вычисления по умолчанию: 'exact', если имеется менее 100 наблюдений и 'approximate' при наличии 100 или более наблюдений.

Пример: 'Method','exact'

Тип испытания, указанный как разделенная запятыми пара, состоящая из 'Tail' и одно из следующих:

'both'

Двусторонний тест гипотез, который является типом теста по умолчанию.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения со средней, отличной от нуля (или m).

  • Для теста с двумя выборками альтернативная гипотеза утверждает, что данные в x-y происходит из распределения со средней, отличной от нуля.

'right'

Правохвостый тест гипотезы.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой больше нуля (или m).

  • Для теста с двумя выборками альтернативная гипотеза указывает данные в x-y происходит из распределения с медианой больше нуля.

'left'

Левохвостый тест гипотезы.

  • Для теста с одним образцом альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой меньше нуля (или m).

  • Для теста с двумя выборками альтернативная гипотеза утверждает данные в x-y происходит из распределения с медианой меньше нуля.

Пример: 'Tail','left'

Выходные аргументы

свернуть все

p-значение теста, возвращаемое как неотрицательный скаляр от 0 до 1. p - вероятность наблюдения проверочной статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. signtest вычисляет двустороннее значение p путем удвоения наиболее значительного одностороннего значения.

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отклонение нулевой гипотезы при 100 * Alpha% уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в 100 * Alpha% уровень значимости.

Статистика тестирования, возвращенная в виде структуры. Статистика теста, сохраненная в stats являются:

  • signЗначение статистики проверки знака.

  • zvalЗначение z-статистики (вычисляется только для больших выборок).

Подробнее

свернуть все

Тест подписи

Знаковый тест является непараметрическим тестом для медианы популяции или медианы разницы двух популяций.

Например, для тестов на одной медиане населения:

  • Если тест двусторонний, то статистика теста, S, является минимальным из числа наблюдений, которые меньше или больше, чем предполагаемое медианное значение, M0.

  • Если тест является правосторонним, то S - это количество наблюдений, которое больше, чем предполагаемое медианное значение M0.

  • Если тест левосторонний, то S - это число наблюдений, которое меньше, чем предполагаемое медианное значение M0.

z-Статистика

Для большого образца, signtest использует z-статистику для аппроксимации значения p.

signtest test statistic - количество элементов, превышающих 0 (для signtest(x) или signtest(x-y)), или m (для signtest(x,m)). Следовательно, z-статистика теста знака с коррекцией непрерывности равна:

z = (S E (S)) V (S) = (S − (0,5) n 0,5 сигн (npos nneg)) (0,5) (0,5) n,

где npos и nneg - количество положительных и отрицательных отличий от гипотетического медианного значения соответственно.

Алгоритмы

Для теста с одним образцом, signtest пропускает значения в x которые равны нулю или NaN.

Для испытания с использованием двух образцов: signtest пропускает значения в xy которые равны нулю или NaN.

Ссылки

[1] Гиббонс, Дж. Д. и С. Чакраборти. Непараметрический статистический вывод, 5-й ред. Бока Ратон, Флорида: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вулф. Непараметрические статистические методы. Хобокен, Нью-Джерси: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлен до R2006a