Несколько сравнений

Введение

Дисперсионный анализ (Дисперсионный Анализ), который тестируют методы, равен ли набор средних значений группы (эффекты обработки) или нет. Отклонение нулевой гипотезы приводит к заключению, что не все средние значения группы являются тем же самым. Этот результат, однако, не предоставляет дополнительную информацию, на которой средние значения группы отличаются.

Выполнение серии t - тестирует, чтобы определить, какие пары средних значений существенно отличаются, не рекомендуется. Когда вы выполняете несколько t - тесты, вероятность, что средние значения кажутся значительными, и результаты значительной разницы могут произойти из-за большого количества тестов. Они t - тесты используют данные из той же выборки, следовательно они весьма зависимы. Этот факт делает более трудным определить количество уровня значения для нескольких тестов.

Предположим, что в одном t - тест, вероятность, что нулевая гипотеза _(H0) отклоняется, когда это на самом деле верно, является маленьким значением, скажите 0.05. Предположим также, что вы проводите шесть независимых t - тесты. Если уровень значения для каждого теста 0.05, то вероятность, что тестам правильно не удается отклонить _H0, когда _H0 верен для каждого случая, (0.95)⁶ = 0.735. И вероятность, что один из тестов неправильно отклоняет нулевую гипотезу, равняется 1 – 0.735 = 0.265, который намного выше, чем 0,05.

Чтобы компенсировать несколько тестов, можно использовать несколько процедур сравнения. Функция Statistics and Machine Learning Toolbox™ multcompare выполняет несколько попарно сравнение средних значений группы или эффекты обработки. Опции являются честно критерием значительной разницы Туки (опция по умолчанию), метод Bonferroni, процедура Шеффа, младшие значащие различия Фишера (LSD) метод и подход Dunn & Sidák к t - тест.

Чтобы выполнить несколько сравнений средних значений группы, предоставьте структуре stats как вход для multcompare. Можно получить stats от одной из следующих функций:

anova1 — Однофакторный дисперсионный анализ
anova2 — Двухсторонний Дисперсионный Анализ
anovan — N - путь Дисперсионный Анализ
aoctool — Интерактивный ANCOVA
kruskalwallis — Непараметрический метод для одностороннего размещения
friedman — Непараметрический метод для двухстороннего размещения

Для нескольких опций процедуры сравнения для повторных измерений смотрите multcompare (RepeatedMeasuresModel).

Несколько сравнений Используя ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Скрипт Open Live Script

Загрузите выборочные данные.

load carsmall

MPG представляет мили на галлон для каждого автомобиля и Cylinders представляет количество цилиндров в каждом автомобиле, или 4, 6, или 8 цилиндров.

Протестируйте, если средние мили на галлон (миля на галлон) отличаются через автомобили, которые имеют различные количества цилиндров. Также вычислите статистику, необходимую для нескольких тестов сравнения.

[p,~,stats] = anova1(MPG,Cylinders,'off');
p

p = 4.4902e-24

Маленькое p-значение приблизительно 0 является верным признаком, что средние мили на галлон существенно отличаются через автомобили с различными количествами цилиндров.

Выполните тест сравнения кратного, с помощью метода Bonferroni, чтобы определить, какие количества цилиндров имеют значение в эффективности автомобилей.

[results,means] = multcompare(stats,'CType','bonferroni')

Figure Multiple comparison of means contains an axes object. The axes object with title Click on the group you want to test contains 7 objects of type line.

results = 3×6

    1.0000    2.0000    4.8605    7.9418   11.0230    0.0000
    1.0000    3.0000   12.6127   15.2337   17.8548    0.0000
    2.0000    3.0000    3.8940    7.2919   10.6899    0.0000

means = 3×2

   29.5300    0.6363
   21.5882    1.0913
   14.2963    0.8660

В results матрица, 1, 2, и 3 соответствует автомобилям с 4, 6, и 8 цилиндров, соответственно. Первые два столбца показывают, какие группы сравнены. Например, первая строка сравнивает автомобили с 4 и 6 цилиндрами. Четвертый столбец показывает среднее значение mpg различие для сравненных групп. Третьи и пятые колонны показывают нижние и верхние пределы для 95%-го доверительного интервала для различия в средних значениях группы. Последний столбец показывает p-значения для тестов. Все p-значения являются нулем, который указывает, что среднее значение mpg для всех групп отличается через все группы.

На рисунке синяя панель представляет группу автомобилей с 4 цилиндрами. Красные панели представляют другие группы. Ни один из красных интервалов сравнения для среднего значения mpg автомобильного перекрытия, что означает, что среднее значение mpg существенно отличается для автомобилей, имеющих 4, 6, или 8 цилиндров.

Первый столбец means матрица имеет среднее значение mpg оценки для каждой группы автомобилей. Второй столбец содержит стандартные погрешности оценок.

Несколько сравнений для Дисперсионного Анализа С тремя путями

Скрипт Open Live Script

Загрузите выборочные данные.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

y вектор отклика и g1, g2, и g3 сгруппированные переменные (факторы). Каждый фактор имеет два уровня и каждое наблюдение в y идентифицирован комбинацией факторных уровней. Например, наблюдение y(1) сопоставлен с уровнем 1 факторного g1, уровень 'hi' из факторного g2, и уровень 'may' из факторного g3. Точно так же наблюдение y(6) сопоставлен с уровнем 2 факторного g1, уровень 'hi' из факторного g2, и уровень 'june' из факторного g3.

Протестируйте, если ответ является тем же самым для всех факторных уровней. Также вычислите статистику, требуемую для нескольких тестов сравнения.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...
    'varnames',{'g1','g2','g3'});

Figure N-Way ANOVA contains objects of type uicontrol.

P-значение 0,2578 указывает что средние ответы для уровней 'may' и 'june' из факторного g3 не существенно отличаются. P-значение 0,0347 указывает что средние ответы для уровней 1 и 2 из факторного g1 существенно отличаются. Точно так же p-значение 0,0048 указывает что средние ответы для уровней 'hi' и 'lo' из факторного g2 существенно отличаются.

Выполните несколько тестов сравнения, чтобы узнать который группы факторов g1 и g2 существенно отличаются.

results = multcompare(stats,'Dimension',[1 2])

Figure Multiple comparison of population marginal means contains an axes object. The axes object with title Click on the group you want to test contains 9 objects of type line.

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0272
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0170
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0136
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0101
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0087
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0737

multcompare сравнивает комбинации групп (уровни) этих двух сгруппированных переменных, g1 и g2. В results матрица, номер 1 соответствует комбинации уровня 1 из g1 и уровень hi из g2, номер 2 соответствует комбинации уровня 2 из g1 и уровень hi из g2. Точно так же номер 3 соответствует комбинации уровня 1 из g1 и уровень lo из g2, и номер 4 соответствует комбинации уровня 2 из g1 и уровень lo из g2. Последний столбец матрицы содержит p-значения.

Например, первая строка матрицы показывает что комбинация уровня 1 из g1 и уровень hi из g2 имеет те же средние значения отклика как комбинация уровня 2 из g1 и уровень hi из g2. P-значение, соответствующее этому тесту, 0.0280, который указывает, что средние ответы существенно отличаются. Можно также видеть этот результат на рисунке. Синяя панель показывает интервал сравнения для среднего ответа для комбинации уровня 1 из g1 и уровень hi из g2. Красные панели являются интервалами сравнения для среднего ответа для других комбинаций группы. Ни одна из красных панелей не перекрывается с синей панелью, что означает средний ответ для комбинации уровня 1 из g1 и уровень hi из g2 существенно отличается от среднего ответа для других комбинаций группы.

Можно протестировать другие группы путем нажатия на соответствующий интервал сравнения для группы. Панель вы нажимаете на повороты к синему. Панели для групп, которые существенно отличаются, являются красными. Панели для групп, которые не существенно отличаются, являются серыми. Например, если вы нажимаете на интервал сравнения для комбинации уровня 1 из g1 и уровень lo из g2, интервал сравнения для комбинации уровня 2 из g1 и уровень lo из g2 перекрытия, и являются поэтому серыми. С другой стороны другие интервалы сравнения являются красными, указывая на значительную разницу.

Несколько процедур сравнения

Чтобы задать несколько процедура сравнения, вы хотите multcompare чтобы провести используют 'CType' аргумент пары "имя-значение". multcompare обеспечивает следующие процедуры:

Честно процедура значительной разницы Туки
Метод Bonferroni
Dunn & Sidák’s Approach
Младшее значащее различие
Процедура Шеффа

Честно процедура значительной разницы Туки

Можно задать честно процедуру значительной разницы Туки с помощью 'CType','Tukey-Kramer' или 'CType','hsd' аргумент пары "имя-значение". Тест основан на распределении области значений studentized. Отклоните H _0:_αi = _αj если

$| t | = \frac{| {\bar{y}}_{i} - {\bar{y}}_{j} |}{\sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}} > \frac{1}{\sqrt{2}} q_{α, k, N - k,}$

где $q_{α, k, N - k}$ верхние 100* (1 – α) th процентиль распределения области значений studentized параметром k и N – степени свободы k. k является количеством групп (обработки или крайние средние значения), и N является общим количеством наблюдений.

Честно процедура значительной разницы Туки оптимальна для сбалансированного однофакторного дисперсионного анализа и подобных процедур с равными объемами выборки. Это, как доказывали, было консервативно для однофакторного дисперсионного анализа с различными объемами выборки. Согласно бездоказательной догадке Туки-Крамера, также правильно для проблем, где сравниваемые количества коррелируются, как в ковариационном анализе с несбалансированными ковариационными значениями.

Метод Bonferroni

Можно задать метод Bonferroni с помощью 'CType','bonferroni' пара "имя-значение". Этот метод использует критические значения от t Студента - распределение после корректировки, чтобы компенсировать несколько сравнений. Тест отклоняет H _0:_αi = _αj в $α / 2 (\begin{array}{l} k \\ 2 \end{array})$ уровень значения, где k является количеством групп если

$| t | = \frac{| {\bar{y}}_{i} - {\bar{y}}_{j} |}{\sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}} > t_{\frac{α}{2 (\begin{matrix} k \\ 2 \end{matrix})}, N - k,}$

где N является общим количеством наблюдений, и k является количеством групп (крайние средние значения). Эта процедура консервативна, но обычно меньше, чем процедура Scheffé.

Dunn & Sidák’s Approach

Можно задать подход Dunn & Sidák с помощью 'CType','dunn-sidak' аргумент пары "имя-значение". Это использует критические значения от t - распределение после корректировки к нескольким сравнениям, которая была предложена Данном и оказалась точной Sidák. Этот тест отклоняет H _0:_αi = _αj если

$| t | = \frac{| {\bar{y}}_{i} - {\bar{y}}_{j} |}{\sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}} > t_{1 - η / 2, v,}$

где

$η = 1 - {(1 - α)}^{^{\frac{1}{(\begin{array}{l} k \\ 2 \end{array})}}}$

и k является количеством групп. Эта процедура похожа на, но менее консервативна, чем, процедура Bonferroni.

Младшее значащее различие

Можно задать наименьшее количество процедуры различия в значении с помощью 'CType','lsd' аргумент пары "имя-значение". Этот тест использует тестовую статистическую величину

$t = \frac{{\bar{y}}_{i} - {\bar{y}}_{j}}{\sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}} .$

Это отклоняет H _0:_αi = _αj если

$| {\bar{y}}_{i} - {\bar{y}}_{j} | > \underset{L S D}{\underset{︸}{t_{\frac{α}{2}, N - k} \sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}}} .$

Фишер предлагает защиту от нескольких сравнений путем выполнения LSD только когда нулевая гипотеза _H0: α ₁ = α ₂ =... = α _k отклоняется Дисперсионным Анализом F - тест. Даже в этом случае LSD не может отклонить ни одну из отдельных гипотез. Также возможно, что Дисперсионный Анализ не отклоняет _H0, даже когда существуют различия между некоторыми средними значениями группы. Это поведение происходит, потому что равенство остающихся средних значений группы может вызвать F - тестируют статистическую величину, чтобы быть незначащим. Без любого условия LSD не обеспечивает защиты против нескольких проблема сравнения.

Процедура Шеффа

Можно задать процедуру Шеффа с помощью 'CType','scheffe' аргумент пары "имя-значение". Критические значения получены на распределение F. Тест отклоняет H _0:_αi = _αj если

$\frac{| {\bar{y}}_{i} - {\bar{y}}_{j} |}{\sqrt{M S E (\frac{1}{n_{i}} + \frac{1}{n_{j}})}} > \sqrt{(k - 1) F_{k - 1, N - k, α}}$

Эта процедура обеспечивает одновременный доверительный уровень для сравнений всех линейных комбинаций средних значений. Это консервативно для сравнений простых различий пар.

Ссылки

[1] Милликругозор G. А. и Д. Э. Джонсон. Анализ грязных данных. Объем I: спроектированные эксперименты. Бока-Ратон, FL: Chapman & Hall/CRC Press, 1992.

[2] Нетер Дж., М. Х. Катнер, К. Дж. Нахцхайм, В. Вассерман. 4-й редактор Прикладное Линейное Статистическое Нажатие Models.Irwin, 1996.

[3] Hochberg, Y. и А. К. Тамхэйн. Несколько процедур сравнения. Хобокен, NJ: John Wiley & Sons, 1987.

Документация