Дисперсионный анализ (АНОВА), которую тестируют методы, равен ли набор средних значений группы (эффекты обработки) или нет. Отклонение нулевой гипотезы приводит к заключению, что не все средние значения группы являются тем же самым. Этот результат, однако, не предоставляет дополнительную информацию, на которой средние значения группы отличаются.
Выполнение серии t - тестирует, чтобы определить, какие пары средних значений существенно отличаются, не рекомендуется. Когда вы выполняете несколько t - тесты, вероятность, что средние значения кажутся значительными, и результаты значительной разницы могут произойти из-за большого количества тестов. Они t - тесты используют данные из той же выборки, следовательно они весьма зависимы. Этот факт делает более трудным определить количество уровня значения для нескольких тестов.
Предположим, что в одном t - тест, вероятность, что нулевая гипотеза (H0) отклоняется, когда это на самом деле верно, является маленьким значением, скажите 0.05. Предположим также, что вы проводите шесть независимых t - тесты. Если уровень значения для каждого теста 0.05, то вероятность, что тестам правильно не удается отклонить H0, когда H0 верен для каждого случая, (0.95) 6 = 0.735. И вероятность, что один из тестов неправильно отклоняет нулевую гипотезу, равняется 1 – 0.735 = 0.265, который намного выше, чем 0,05.
Чтобы компенсировать несколько тестов, можно использовать несколько процедур сравнения. Функция Statistics and Machine Learning Toolbox™ multcompare
выполняет несколько попарно сравнение средних значений группы или эффекты обработки. Опции являются честно критерием значительной разницы Туки (опция по умолчанию), метод Bonferroni, процедура Шеффа, младшие значащие различия Фишера (LSD) метод и подход Dunn & Sidak к t - тест.
Чтобы выполнить несколько сравнений средних значений группы, предоставьте структуре stats
как вход для multcompare
. Можно получить stats
из одной из следующих функций:
kruskalwallis
— Непараметрический метод для одностороннего размещения
friedman
— Непараметрический метод для двухстороннего размещения
Для нескольких опций процедуры сравнения для повторных мер смотрите multcompare
(RepeatedMeasuresModel
).
Загрузите выборочные данные.
load carsmall
MPG
представляет мили на галлон для каждого автомобиля, и Cylinders
представляет количество цилиндров в каждом автомобиле, или 4, 6, или 8 цилиндров.
Протестируйте, если средние мили на галлон (миля на галлон) отличаются через автомобили, которые имеют различные количества цилиндров. Также вычислите статистику, необходимую для нескольких тестов сравнения.
[p,~,stats] = anova1(MPG,Cylinders,'off');
p
p = 4.4902e-24
Маленькое p-значение приблизительно 0 является верным признаком, что средние мили на галлон существенно отличаются через автомобили с различными количествами цилиндров.
Выполните тест сравнения кратного, с помощью метода Bonferroni, чтобы определить, какие количества цилиндров имеют значение в производительности автомобилей.
[results,means] = multcompare(stats,'CType','bonferroni')
results = 3×6
1.0000 2.0000 4.8605 7.9418 11.0230 0.0000
1.0000 3.0000 12.6127 15.2337 17.8548 0.0000
2.0000 3.0000 3.8940 7.2919 10.6899 0.0000
means = 3×2
29.5300 0.6363
21.5882 1.0913
14.2963 0.8660
В матрице results
, 1, 2, и 3 соответствуют автомобилям с 4, 6, и 8 цилиндров, соответственно. Первые два столбца показывают, какие группы сравнены. Например, первая строка сравнивает автомобили с 4 и 6 цилиндрами. Четвертый столбец показывает среднее значение mpg различие для сравненных групп. Третьи и пятые колонны показывают нижние и верхние пределы для 95%-го доверительного интервала для различия в средних значениях группы. Последний столбец показывает p-значения для тестов. Все p-значения являются нулем, который указывает, что среднее значение mpg для всех групп отличается через все группы.
В фигуре синяя панель представляет группу автомобилей с 4 цилиндрами. Красные панели представляют другие группы. Ни один из красных интервалов сравнения для среднего значения mpg автомобильного перекрытия, что означает, что среднее значение mpg существенно отличается для автомобилей, имеющих 4, 6, или 8 цилиндров.
Первый столбец матрицы means
имеет среднее значение mpg оценки для каждой группы автомобилей. Второй столбец содержит стандартные погрешности оценок.
Загрузите выборочные данные.
y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]'; g1 = [1 2 1 2 1 2 1 2]; g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};
y
является вектором отклика и g1
, g2
, и g3
является группирующими переменными (факторы). Каждый фактор имеет два уровня, и каждое наблюдение в y
идентифицировано комбинацией факторных уровней. Например, наблюдение y(1)
сопоставлено с уровнем 1 факторного g1
, уровень 'hi'
факторного g2
и уровень 'may'
факторного g3
. Точно так же наблюдение y(6)
сопоставлено с уровнем 2 факторного g1
, уровень 'hi'
факторного g2
и уровень 'june'
факторного g3
.
Протестируйте, если ответ является тем же самым для всех факторных уровней. Также вычислите статистику, требуемую для нескольких тестов сравнения.
[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',... 'varnames',{'g1','g2','g3'});
P-значение 0,2578 указывает, что средние ответы для уровней 'may'
и 'june'
факторного g3
не существенно отличаются. P-значение 0,0347 указывает, что средние ответы для уровней 1
и 2
факторного g1
существенно отличаются. Точно так же p-значение 0,0048 указывает, что средние ответы для уровней 'hi'
и 'lo'
факторного g2
существенно отличаются.
Выполните несколько тестов сравнения, чтобы узнать, какие группы факторов g1
и g2
существенно отличаются.
results = multcompare(stats,'Dimension',[1 2])
results = 6×6
1.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0280
1.0000 3.0000 4.4896 6.9500 9.4104 0.0177
1.0000 4.0000 6.1396 8.6000 11.0604 0.0143
2.0000 3.0000 8.8896 11.3500 13.8104 0.0108
2.0000 4.0000 10.5396 13.0000 15.4604 0.0095
3.0000 4.0000 -0.8104 1.6500 4.1104 0.0745
multcompare
сравнивает комбинации групп (уровни) этих двух группирующих переменных, g1
и g2
. В матрице results
номер 1 соответствует комбинации уровня 1
g1
и уровня hi
g2
, номер 2 соответствует комбинации уровня 2
g1
и уровня hi
g2
. Точно так же номер 3 соответствует комбинации уровня 1
g1
и уровня lo
g2
, и номер 4 соответствует комбинации уровня 2
g1
и уровня lo
g2
. Последний столбец матрицы содержит p-значения.
Например, первая строка матрицы показывает, что комбинация уровня 1
g1
и уровня hi
g2
имеет те же средние значения ответа как комбинация уровня 2
g1
и уровня hi
g2
. P-значение, соответствующее этому тесту, 0.0280, который указывает, что средние ответы существенно отличаются. Можно также видеть этот результат в фигуре. Синяя панель показывает интервал сравнения для среднего ответа для комбинации уровня 1
g1
и уровня hi
g2
. Красные панели являются интервалами сравнения для среднего ответа для других комбинаций группы. Ни одна из красных панелей не накладывается с синей панелью, что означает средний ответ для комбинации уровня 1
g1
и уровня, hi
g2
существенно отличается от среднего ответа для других комбинаций группы.
Можно протестировать другие группы путем нажатия на соответствующий интервал сравнения для группы. Панель вы нажимаете на повороты к синему. Панели для групп, которые существенно отличаются, являются красными. Панели для групп, которые не существенно отличаются, являются серыми. Например, если вы нажимаете на интервал сравнения для комбинации уровня 1
g1
и уровня lo
g2
, интервала сравнения для комбинации уровня 2
g1
и уровня lo
перекрытий g2
, и является поэтому серым. С другой стороны другие интервалы сравнения являются красными, указывая на значительную разницу.
Чтобы задать несколько процедура сравнения, вы хотите, чтобы multcompare
провел, используют аргумент пары "имя-значение" 'CType'
. multcompare
обеспечивает следующие процедуры:
Можно задать честно процедуру значительной разницы Туки с помощью аргумента пары "имя-значение" 'CType','Tukey-Kramer'
или 'CType','hsd'
. Тест основан на распределении области значений studentized. Отклоните H 0:αi = αj если
где верхние 100* (1 – α) th процентиль распределения области значений studentized с параметром k и N – степени свободы k. k является количеством групп (обработки или крайние средние значения), и N является общим количеством наблюдений.
Честно процедура значительной разницы Туки оптимальна для сбалансированной односторонней АНОВОЙ и подобных процедур с равными объемами выборки. Это, как доказывали, было консервативно для односторонней АНОВОЙ с различными объемами выборки. Согласно бездоказательной догадке Туки-Крамера, также правильно для проблем, где сравниваемые количества коррелируются, как в ковариационном анализе с несбалансированными ковариационными значениями.
Можно задать метод Bonferroni с помощью пары "имя-значение" 'CType','bonferroni'
. Этот метод использует критические значения от t Студента - распределение после корректировки, чтобы компенсировать несколько сравнений. Тест отклоняет H 0:αi = αj в уровень значения, где k является количеством групп если
где N является общим количеством наблюдений, и k является количеством групп (крайние средние значения). Эта процедура консервативна, но обычно меньше, чем процедура Scheffé.
Можно задать подход Dunn & Sidak с помощью аргумента пары "имя-значение" 'CType','dunn-sidak'
. Это использует критические значения от t - распределение после корректировки к нескольким сравнениям, которая была предложена Данном и оказалась точной Sidák. Этот тест отклоняет H 0:αi = αj если
где
и k является количеством групп. Эта процедура подобна, но менее консервативна, чем, процедура Bonferroni.
Можно задать наименьшее количество процедуры различия в значении с помощью аргумента пары "имя-значение" 'CType','lsd'
. Этот тест использует тестовую статистическую величину
Это отклоняет H 0:αi = αj если
Фишер предлагает защиту от нескольких сравнений путем выполнения LSD только когда нулевая гипотеза H0: α 1 = α 2 =... = α k отклоняется АНОВОЙ F - тест. Даже в этом случае LSD не может отклонить ни одну из отдельных гипотез. Также возможно, что АНОВА не отклоняет H0, даже когда существуют различия между некоторыми средними значениями группы. Это поведение происходит, потому что равенство остающихся средних значений группы может вызвать F - тестируют статистическую величину, чтобы быть незначащим. Без любого условия LSD не обеспечивает защиты против нескольких проблема сравнения.
Можно задать процедуру Шеффа с помощью аргумента пары "имя-значение" 'CType','scheffe'
. Критические значения получены на распределение F. Тест отклоняет H 0:αi = αj если
Эта процедура обеспечивает одновременный доверительный уровень для сравнений всех линейных комбинаций средних значений. Это консервативно для сравнений простых различий пар.
[1] Милликругозор G. А. и Д. Э. Джонсон. Анализ грязных данных. Объем I: разработанные эксперименты. Бока-Ратон, FL: Chapman & Hall/CRC Press, 1992.
[2] Нетер Дж., М. Х. Катнер, К. Дж. Нахцхайм, В. Вассерман. 4-й редактор Прикладные Линейные Статистические модели. Ирвин Пресс, 1996.
[3] Hochberg, Y. и А. К. Тамхэйн. Несколько процедур сравнения. Хобокен, NJ: John Wiley & Sons, 1987.
anova1
| anova2
| anovan
| aoctool
| friedman
| kruskalwallis
| multcompare