signtest

Описание

пример

p = signtest(x) возвращает p -value для двухстороннего знакового теста .

signtest проверяет гипотезу о том, что данные в x имеет непрерывное распределение с нулевой медианой относительно альтернативы, что распределение не имеет нулевой медианы на уровне 5% значимости.

пример

p = signtest(x,y) возвращает p -значение двухстороннего знакового теста. Здесь, signtest проверяет на гипотезу, что данные в xy имеет распределение с нулевой медианой относительно альтернативы, что распределение не имеет нулевой медианы. Обратите внимание, что гипотеза о нулевой медиане для xy не эквивалентно гипотезе равной медианы для x и y.

пример

p = signtest(x,y,Name,Value) возвращает p -value для знакового теста с дополнительными опциями, заданными одним или несколькими Name, Value аргументы в виде пар.

[p,h] = signtest(___) также возвращает логическое значение, указывающее на решение теста. Значение h = 1 указывает на отказ от нулевой гипотезы, и h = 0 указывает, что отказ отклонить гипотезу null на уровне 5% значимости. Можно использовать любой из входных параметров в предыдущих синтаксисах.

пример

[p,h,stats] = signtest(___) также возвращает структуру stats содержащая информацию о тестовой статистике.

пример

[___] = signtest(x,m) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста, являются ли данные в x являются наблюдениями из распределения с медианной m против альтернативы, что медиана отличается от m.

пример

[___] = signtest(x,m,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста со знаком с дополнительными опциями, заданными одной или несколькими Name, Value аргументы в виде пар.

Примеры

свернуть все

Проверьте гипотезу о нулевой медиане.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = randn(1,25);

Распределение дискретизации x симметрично с нулевой медианой.

Проверьте нулевую гипотезу, что x происходит из распределения с медианой, отличной от нулевой медианы.

[p,h,stats] = signtest(x,0)
p = 0.1078
h = logical
   0

stats = struct with fields:
    zval: NaN
    sign: 17

На уровне значимости 5% по умолчанию результат h = 0 указывает, что signtest не отклоняется до нулевой гипотезы нулевой медианы. signtest вычисляет значение p с помощью точного метода, поэтому не вычисляет zval и возвращает его как NaN.

Проверьте гипотезу нулевой медианы на различие между парными выборками.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
before = lognrnd(2,.25,10,1);
after = before + (lognrnd(0,.5,10,1) - 1);

Распределение дискретизации различия между before и after симметрично с нулевой медианой.

Проверяйте нулевую гипотезу, что различие before и after имеет нулевую медиану.

[p,h] = signtest(before,after)
p = 0.7539
h = logical
   0

На уровне значимости 5% по умолчанию значение h = 0 указывает, что signtest не отклоняется до нулевой гипотезы нулевой медианы в различии.

Проверьте гипотезу о нулевой медиане на различие между двумя парными выборками с помощью точного и приблизительного методов.

Сгенерируйте выборочные данные.

rng('default') % for reproducibility
x = lognrnd(2,.25,15,1);
y = x + trnd(2,15,1);
display([x y])
    8.4521    7.8047
   11.6869   11.4094
    4.2009    5.1133
    9.1664   12.1655
    8.0020   10.0300
    5.3285    6.0153
    6.6300    5.1235
    8.0499    8.6737
   18.0763   19.2164
   14.7665   15.3380
    5.2726    8.4187
   15.7798   16.2093
    8.8583    8.5575
    7.2735    7.4783
    8.8347    7.8894

Проверяйте гипотезу, что xy имеет нулевую медиану.

[p,h,stats] = signtest(x,y)
p = 0.3018
h = logical
   0

stats = struct with fields:
    zval: NaN
    sign: 5

На уровне значимости 5% по умолчанию значение h = 0 указывает, что тест не может отклонить нулевую гипотезу нуля медианы в различие.

Повторите тест с помощью приблизительного метода.

[p,h,stats] = signtest(x,y,'Method','approximate')
p = 0.3017
h = logical
   0

stats = struct with fields:
    zval: -1.0328
    sign: 5

Приблизительное p-значение, какие signtest получает с помощью z-statistic, действительно близко к точному p-значение.

Выполните тест левого знака для больших выборок.

Загрузите выборочные данные.

load gradespaired

Проверьте нулевую гипотезу о том, что медиана различий классов до и после программы репетиторства равна 0 против альтернативы, что она меньше 0.

[p,h,stats] = signtest(gradespaired(:,1),gradespaired(:,2),'Tail','left')
p = 0.0013
h = logical
   1

stats = struct with fields:
    zval: -3.0110
    sign: 37

Поскольку размер выборки велик (больше 100), signtest использует приблизительный метод, чтобы вычислить p-value, а также возвращает значение z-статистический. Тест отклоняет нулевую гипотезу об отсутствии различий между медианами оценки на уровне 5% значимости.

Проверьте гипотезу о том, что население отличается от заданного значения.

Загрузите выборочные данные.

load lawdata

Набор данных имеет 15 наблюдений за переменными gpa и lsat.

Проверьте гипотезу, что медиана lsat счет выше 570.

[p,h,stats] = signtest(lsat,570,'Tail','right')
p = 0.0176
h = logical
   1

stats = struct with fields:
    zval: NaN
    sign: 12

Оба p-значение, 0,0176 и h = 1 указывают, что на уровне 5% значимости тест заключает в пользу альтернативной гипотезы.

Входные параметры

свернуть все

Выборочные данные, заданная как вектор.

Типы данных: single | double

Выборочные данные, заданная как вектор. y должна быть такой же длины, как и x.

Типы данных: single | double

Гипотезированное значение медианы, заданное как скаляр.

Пример: signtest(x,35)

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'Method','approximate','Tail','right' задает критерий правохвостого знака с уровнем значимости 1%, который возвращает приблизительное значение p.

Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений от 0 до 1. Значение по умолчанию Alpha составляет 0,05. Уровень значимости h равен 100 * Alpha%.

Пример: 'Alpha', 0.01

Типы данных: double | single

p - метод расчета значений, заданный как разделенная разделенными запятой парами, состоящая из 'Method' и одно из следующих:

'exact'Точный расчет p -значение, p.
'approximate'Нормальное приближение для вычисления p -значение, p.

Метод расчетов по умолчанию 'exact', если наблюдений и 'approximate' меньше 100 если наблюдений 100 или более.

Пример: 'Method', 'exact'

Тип теста, заданный как разделенная разделенными запятой парами, состоящая из 'Tail' и одно из следующих:

'both'

Двусторонний тест гипотезы, который является типом теста по умолчанию.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит из непрерывного распределения с медианой, отличной от нуля (или m).

  • Для теста с двумя выборками альтернативная гипотеза утверждает, что данные в x-y происходит из распределения с медианой, отличной от нуля.

'right'

Критерий правохвостой гипотезы.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит от непрерывного распределения с медианой, большей нуля (или m).

  • Для двухвыборочного теста альтернативная гипотеза утверждает данные в x-y происходит из распределения с медианой, большей нуля.

'left'

Критерий левохвостой гипотезы.

  • Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x происходит от непрерывного распределения с медианой меньше нуля (или m).

  • Для двухвыборочного теста альтернативная гипотеза утверждает данные в x-y происходит из распределения с медианой меньше нуля.

Пример: 'Tail', 'left'

Выходные аргументы

свернуть все

p значение теста, возвращенное как неотрицательный скаляр от 0 до 1. p - вероятность наблюдения тестовой статистики как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. signtest вычисляет двустороннее p -value путем удвоения наиболее значимого одностороннего значения.

Результат проверки гипотезы, возвращенный как логическое значение.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в Alpha 100 *% уровня значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha 100 *% уровня значимости.

Тестовая статистика, возвращенная как структура. Тестовая статистика сохранена в stats являются:

  • sign: Значение тестовой статистики знака.

  • zval: Значение z-статистики (вычисляется только для больших выборок).

Подробнее о

свернуть все

Тест знака

Знаковый тест является непараметрическим тестом для медианы населения или медианы различия двух населений.

Например, для тестов на одном населении:

  • Если тест двусторонний, то тестовая статистика, S, является минимумом количества наблюдений, которые меньше или больше, чем гипотезированное медианное значение, M 0.

  • Если тест является правосторонним, то S количество наблюдений, которые больше, чем гипотезированное медианное значение M 0 .

  • Если тест является левосторонним, то S количество наблюдений, которые меньше, чем гипотезированное медианное значение M 0.

z-Statistic

Для большой выборки, signtest использует z -statistic, чтобы аппроксимировать p -значение.

The signtest test statistic - количество элементов, которые больше 0 (для signtest(x) или signtest(x-y)), или m (для signtest(x,m)). Следовательно, z-статический тест знака с коррекцией непрерывности является :

z=(SE(S))V(S)=(S(0.5)n0.5sign(nposnneg))(0.5)(0.5)n,

где npos и nneg - количество положительных и отрицательных различий от гипотезированного медианного значения, соответственно.

Алгоритмы

Для теста с одним образцом, signtest опускает значения в x которые являются нулем или NaN.

Для теста с двумя образцами, signtest опускает значения в xy которые являются нулем или NaN.

Ссылки

[1] Гиббонс, Дж. Д., и С. Чакраборти. Непараметрический статистический вывод, 5th Ed. Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Холландер, М. и Д. А. Вульф. Непараметрические статистические методы. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

См. также

| | |

Представлено до R2006a