exponenta event banner

ttest2

T-тест с двумя образцами

Описание

пример

h = ttest2(x,y) возвращает тестовое решение для нулевой гипотезы, что данные в векторах x и y происходит из независимых случайных выборок из нормальных распределений с равными средствами и равными, но неизвестными дисперсиями, используя t-тест с двумя выборками. Альтернативная гипотеза заключается в том, что данные в x и y происходит из популяций с неравными средствами. Результат h является 1 если тест отклоняет нулевую гипотезу на уровне значимости 5%, и 0 в противном случае.

пример

h = ttest2(x,y,Name,Value) возвращает решение теста для t-теста с двумя выборками с дополнительными опциями, заданными одним или несколькими аргументами пары имя-значение. Например, можно изменить уровень значимости или провести тест, не предполагая равных отклонений.

пример

[h,p] = ttest2(___) также возвращает значение p, p, теста, используя любой из входных аргументов в предыдущих синтаксисах.

пример

[h,p,ci,stats] = ttest2(___) также возвращает доверительный интервал по разнице значений совокупности, ci, и структура stats содержит информацию о статистике теста.

Примеры

свернуть все

Загрузите набор данных. Создайте векторы, содержащие первый и второй столбцы матрицы данных для представления оценок учащихся на двух экзаменах.

load examgrades
x = grades(:,1);
y = grades(:,2);

Проверьте нулевую гипотезу о том, что две выборки данных получены из популяций с равными средствами.

[h,p,ci,stats] = ttest2(x,y)
h = 0
p = 0.9867
ci = 2×1

   -1.9438
    1.9771

stats = struct with fields:
    tstat: 0.0167
       df: 238
       sd: 7.7084

Возвращенное значение h = 0 указывает, что ttest2 не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%.

Загрузите набор данных. Создайте векторы, содержащие первый и второй столбцы матрицы данных для представления оценок учащихся на двух экзаменах.

load examgrades
x = grades(:,1);
y = grades(:,2);

Проверьте нулевую гипотезу, что два вектора данных из популяций с равными средствами, не предполагая, что популяции также имеют равные дисперсии.

[h,p] = ttest2(x,y,'Vartype','unequal')
h = 0
p = 0.9867

Возвращенное значение h = 0 указывает, что ttest2 не отклоняет нулевую гипотезу на уровне значимости по умолчанию 5%, даже если не предполагаются равные отклонения.

Входные аргументы

свернуть все

Образец данных, указанный как вектор, матрица или многомерный массив. ttest2 удовольствия NaN значения как отсутствующие данные и игнорирует их.

  • Если x и y указаны как векторы, они не должны иметь одинаковую длину.

  • Если x и y указаны как матрицы, они должны иметь одинаковое количество столбцов. ttest2 выполняет отдельный t-тест вдоль каждого столбца и возвращает вектор результатов.

  • Если x и y указаны как многомерные массивы, они должны иметь одинаковый размер вдоль всех измерений, кроме первого несинглтона.

Типы данных: single | double

Образец данных, указанный как вектор, матрица или многомерный массив. ttest2 удовольствия NaN значения как отсутствующие данные и игнорирует их.

  • Если x и y указаны как векторы, они не должны иметь одинаковую длину.

  • Если x и y указаны как матрицы, они должны иметь одинаковое количество столбцов. ttest2 выполняет отдельный t-тест вдоль каждого столбца и возвращает вектор результатов.

  • Если x и y указаны как многомерные массивы, они должны иметь одинаковый размер вдоль всех измерений, кроме первого несинглтона. ttest2 работает по первому несинглтонному измерению.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Tail','right','Alpha',0.01,'Vartype','unequal' задает правохвостый тест на уровне значимости 1% и не предполагает, что x и y имеют равные различия в населении.

Уровень значимости теста гипотезы, определяемый как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1).

Пример: 'Alpha',0.01

Типы данных: single | double

Размер входной матрицы, вдоль которой тестируются средства, указанные как разделенная запятыми пара, состоящая из 'Dim' и положительное целое значение. Например, указание 'Dim',1 проверяет средство столбца, в то время как 'Dim',2 проверяет строковое средство.

Пример: 'Dim',2

Типы данных: single | double

Тип альтернативной гипотезы для оценки, определяемый как разделенная запятыми пара, состоящая из 'Tail' и один из:

  • 'both' - Проверить против альтернативной гипотезы, что население средства не равны.

  • 'right' - Тест против альтернативной гипотезы, что население означает x больше, чем среднее население y.

  • 'left' - Тест против альтернативной гипотезы, что население означает x меньше, чем среднее население y.

ttest2 проверяет нулевую гипотезу о том, что средства популяции равны указанной альтернативной гипотезе.

Пример: 'Tail','right'

Тип дисперсии, указанный как разделенная запятыми пара, состоящая из 'Vartype' и одно из следующих.

'equal'Проведение теста при условии, что x и y являются нормальными распределениями с неизвестными, но равными дисперсиями.
'unequal'Проведение теста при условии, что x и y из нормальных распределений с неизвестными и неравными дисперсиями. Это называется проблемой Беренса-Фишера. ttest2 использует приближение Саттертвейта для эффективных степеней свободы.

Vartype должен быть одним типом отклонения, даже когда x является матрицей или многомерным массивом.

Пример: 'Vartype','unequal'

Выходные аргументы

свернуть все

Результат проверки гипотезы, возвращенный как 1 или 0.

  • Если h = 1, это указывает на отклонение нулевой гипотезы в Alpha уровень значимости.

  • Если h = 0, это указывает на отказ отклонить нулевую гипотезу в Alpha уровень значимости.

p-значение теста, возвращаемое как скалярное значение в диапазоне [0,1]. p - вероятность наблюдения проверочной статистики как экстремальной или более экстремальной, чем наблюдаемая величина при нулевой гипотезе. Малые значения p поставить под сомнение достоверность нулевой гипотезы.

Доверительный интервал для разницы в среднем населении x и y, возвращаемый как двухэлементный вектор, содержащий нижнюю и верхнюю границы 100 × (1 - Alpha)% доверительный интервал.

Статистика испытаний для t-теста с двумя образцами, возвращенная в виде структуры, содержащей следующее:

  • tstat - Значение статистики теста.

  • df - Степени свободы теста.

  • sd - Объединенная оценка стандартного отклонения населения (для случая равной дисперсии) или вектор, содержащий незаполненные оценки стандартных отклонений населения (для случая неравной дисперсии).

Подробнее

свернуть все

T-тест с двумя образцами

T-тест с двумя выборками - это параметрический тест, который сравнивает параметр местоположения двух независимых выборок данных.

Статистика теста:

t = x y sux2n + sy2m,

где x и y являются средствами выборки, sx и sy являются стандартными отклонениями выборки, а n и m - размерами выборки.

В случае, когда предполагается, что две выборки данных получены из популяций с равными дисперсиями, тестовая статистика при нулевой гипотезе имеет t-распределение Стьюдента с n + m - 2 степенями свободы, и стандартные отклонения выборки заменяются объединенным стандартным отклонением.

s = (n 1) sx2 + (m 1) sy2n + m − 2.

В случае, когда не предполагается, что две выборки данных получены из популяций с равными дисперсиями, проверочная статистика при нулевой гипотезе имеет приблизительное распределение Стьюдента t с рядом степеней свободы, заданных приближением Саттертвейта. Этот тест иногда называют t-тестом Уэлча.

Многомерный массив

Многомерный массив имеет более двух измерений. Например, если x является массивом 1 на 3 на 4, то x является трехмерным массивом.

Первое измерение Nonsingleton

Первое несинглтоновое измерение - это первое измерение массива, размер которого не равен 1. Например, если x является массивом 1-на-2-на-3-на-4, затем второе измерение является первым несинглтоновым измерением x.

Совет

  • Использовать sampsizepwr для вычисления:

    • Размер выборки, соответствующий указанным значениям мощности и параметров;

    • Мощность, достигаемая для конкретного размера выборки, учитывая истинное значение параметра;

    • Значение параметра, определяемое с заданными размером выборки и мощностью.

Расширенные возможности

См. также

| |

Представлен до R2006a