ttest2

Двухвыборочный t -тест

Описание

пример

h = ttest2(x,y) возвращает решение теста для нулевой гипотезы о том, что данные в векторах x и y происходит из независимых случайных выборок из нормальных распределений с равными средствами и равными но неизвестными отклонениями, используя двухвыборочный t -test. Альтернативная гипотеза заключается в том, что данные в x и y происходит от населения с неравными средствами. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне 5% значимости и 0 в противном случае.

пример

h = ttest2(x,y,Name,Value) возвращает решение теста для двухвыборочного t -test с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Для примера можно изменить уровень значимости или провести тест, не принимая равные отклонения.

пример

[h,p] = ttest2(___) также возвращает p -значение, p, из теста, с использованием любого из входных параметров в предыдущих синтаксисах.

пример

[h,p,ci,stats] = ttest2(___) также возвращает доверительный интервал по различию населений ci, и структура stats содержащая информацию о тестовой статистике.

Примеры

свернуть все

Загрузите набор данных. Создайте векторы, содержащие первый и второй столбцы матрицы данных, чтобы представлять оценки учащихся на двух экзаменах.

load examgrades
x = grades(:,1);
y = grades(:,2);

Проверьте нулевую гипотезу о том, что две выборки данных из населений с равными средствами.

[h,p,ci,stats] = ttest2(x,y)
h = 0
p = 0.9867
ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

Возвращенное значение h = 0 указывает, что ttest2 не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Загрузите набор данных. Создайте векторы, содержащие первый и второй столбцы матрицы данных, чтобы представлять оценки учащихся на двух экзаменах.

load examgrades
x = grades(:,1);
y = grades(:,2);

Протестируйте нулевую гипотезу о том, что два вектора данных из населений с равными средствами, не принимая, что населения также имеют равные отклонения.

[h,p] = ttest2(x,y,'Vartype','unequal')
h = 0
p = 0.9867

Возвращенное значение h = 0 указывает, что ttest2 не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%, даже если равные отклонения не приняты.

Входные параметры

свернуть все

Выборочные данные, заданная в виде вектора, матрицы или многомерного массива. ttest2 лечит NaN значения как отсутствующие данные и игнорирует их.

  • Если x и y заданы как векторы, они не должны быть одинаковой длины.

  • Если x и y заданы как матрицы, они должны иметь одинаковое число столбцов. ttest2 выполняет отдельный t -test вдоль каждого столбца и возвращает вектор результатов.

  • Если x и y заданы как многомерные массивы, они должны иметь одинаковый размер, кроме первой размерности несинглтона.

Типы данных: single | double

Выборочные данные, заданная в виде вектора, матрицы или многомерного массива. ttest2 лечит NaN значения как отсутствующие данные и игнорирует их.

  • Если x и y заданы как векторы, они не должны быть одинаковой длины.

  • Если x и y заданы как матрицы, они должны иметь одинаковое число столбцов. ttest2 выполняет отдельный t -test вдоль каждого столбца и возвращает вектор результатов.

  • Если x и y заданы как многомерные массивы, они должны иметь одинаковый размер, кроме первой размерности несинглтона. ttest2 работает по первому несинглтону размерности.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Tail','right','Alpha',0.01,'Vartype','unequal' задает правохвостый тест на уровне 1% значимости и не принимает, что x и y имеют равные отклонения в населении.

Уровень значимости критерия гипотезы, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Размерность матрицы входа, вдоль которой можно проверить средство, заданная как разделенная запятой пара, состоящая из 'Dim' и положительное целое значение. Для примера укажите 'Dim',1 проверяет средство столбца, в то время как 'Dim',2 проверяет строку означает.

Пример: 'Dim',2

Типы данных: single | double

Тип альтернативной гипотезы для оценки, заданный как разделенная разделенными запятой парами, состоящая из 'Tail' и один из:

  • 'both' - Тест на альтернативную гипотезу о том, что популяционные средства не равны.

  • 'right' - Тест на альтернативную гипотезу о том, что население означает x больше, чем среднее по населению y.

  • 'left' - Тест на альтернативную гипотезу о том, что население означает x меньше, чем среднее по населению y.

ttest2 проверяет нулевую гипотезу о том, что населения средства равны заданной альтернативной гипотезе.

Пример: 'Tail','right'

Тип отклонения, заданный как разделенная разделенными запятой парами, состоящая из 'Vartype' и одно из следующих.

'equal'Проведите тест, используя предположение, что x и y являются из нормальных распределений с неизвестными, но равными отклонениями.
'unequal'Проведите тест, используя предположение, что x и y являются из нормальных распределений с неизвестными и неравными отклонениями. Это называется проблемой Беренса-Фишера. ttest2 использует приближение Саттертвейта для эффективных степеней свободы.

Vartype должен быть единственным типом отклонений, даже когда x является матрицей или многомерным массивом.

Пример: 'Vartype','unequal'

Выходные аргументы

свернуть все

Результат теста гипотезы, возвращенный как 1 или 0.

  • Если h = 1, это указывает на отказ от нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

p значение теста, возвращенное как скалярное значение в области значений [0,1]. p - вероятность наблюдения тестовой статистики такой же экстремальной, как или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. Малые значения p ставит под сомнение валидность нулевой гипотезы.

Доверительный интервал для различия в популяционных средствах x и y, возвращенный как двухэлементный вектор, содержащий нижние и верхние контуры 100 × (1 - Alpha)% доверительный интервал.

Статистика тестов для двухвыборочного t -test, возвращенная как структура, содержащая следующее:

  • tstat - Значение тестовой статистики.

  • df - Степени свободы теста.

  • sd - Объединенная оценка стандартного отклонения населения (для случая равной дисперсии) или вектор, содержащий неохваченные оценки стандартных отклонений населения (для случая неравной дисперсии).

Подробнее о

свернуть все

Двухвыборочный t -тест

Двухвыборочный t -test является параметрическим тестом, который сравнивает параметр местоположения двух независимых выборок данных.

Тестовая статистика

t=x¯y¯sx2n+sy2m,

где x¯ и y¯ являются средством выборки, sx и sy являются стандартными отклонениями выборки, и n и m являются размерами выборки.

В случае, когда принято, что две выборки данных из населений с равными дисперсиями, тестовая статистическая величина при нулевой гипотезе имеет распределение Стьюдента с n + m - 2 степенями свободы, и стандартные отклонения выборки заменяются объединенным стандартным отклонением

s=(n1)sx2+(m1)sy2n+m2.

В случае, когда не принято, что две выборки данных из населений с равными отклонениями, тестовая статистика при нулевой гипотезе имеет приблизительное t- распределения Стьюдента с рядом степеней свободы, заданных приближением Саттертвейта. Этот тест иногда называют t-test Уэлча.

Многомерный массив

Многомерный массив имеет более чем две размерности. Для примера, если x массив 1 на 3 на 4, затем x является трехмерным массивом.

Первый несинглтон Размерность

Первый несинглтон- размерность является первой размерностью массива, размер которого не равен 1. Для примера, если x является массивом 1 на 2 на 3 на 4, затем второе измерение является первой несинглтонной размерностью x.

Совет

  • Использовать sampsizepwr для вычисления:

    • Размер выборки, который соответствует заданной степени и значениям параметров;

    • Степень, достигнутая для конкретного размера выборки, учитывая истинное значение параметров;

    • Значение параметров, обнаруживаемое с заданными размером выборки и степенью.

Расширенные возможности

См. также

| |

Представлено до R2006a