multcompare

Множественный сравнительный тест

Описание

пример

c = multcompare(stats) возвращает матрицу c результатов парного сравнения из многократного сравнительного теста с использованием информации, содержащейся в stats структура. multcompare также отображает интерактивный график оценок и интервалов сравнения. Каждое среднее значение группы представлено символом, а интервал представлен линией, отходящей от символа. Два групповых средства значительно различаются, если их интервалы являются несвязанными; они существенно не отличаются, если их интервалы перекрываются. Если вы используете мышь для выбора любой группы, то на графике будут подсвечены все другие группы, которые значительно отличаются, если таковые имеются.

пример

c = multcompare(stats,Name,Value) возвращает матрицу парных результатов сравнения, c, с использованием дополнительных опций, заданных одним или несколькими Name,Value аргументы в виде пар. Для примера можно задать интервал доверия или тип критического значения, которое будет использоваться при многократном сравнении.

[c,m] = multcompare(___) также возвращает матрицу, m, который содержит оценочные значения средств (или любых статистических данных, которые сравниваются) для каждой группы и соответствующих стандартных ошибок. Можно использовать любой из предыдущих синтаксисов.

[c,m,h] = multcompare(___) также возвращает указатель, h, к графику сравнения.

пример

[c,m,h,gnames] = multcompare(___) также возвращает массив ячеек, gnames, который содержит имена групп.

Примеры

свернуть все

Загрузите выборочные данные.

load carsmall

Выполните однофакторный дисперсионный анализ (ANOVA), чтобы увидеть, есть ли различие между пробегом автомобилей по происхождению.

[p,t,stats] = anova1(MPG,Origin,'off');

Выполните многократное сравнение средств группы.

[c,m,h,nms] = multcompare(stats);

Figure Multiple comparison of means contains an axes. The axes with title Click on the group you want to test contains 13 objects of type line.

multcompare отображает оценки с интервалами сравнения вокруг них. Можно кликнуть графики каждой страны, чтобы сравнить ее среднее значение с показателями других стран.

Теперь отобразите средние оценки и стандартные ошибки с соответствующими именами групп.

[nms num2cell(m)]
ans=6×3 cell array
    {'USA'    }    {[21.1328]}    {[0.8814]}
    {'Japan'  }    {[31.8000]}    {[1.8206]}
    {'Germany'}    {[28.4444]}    {[2.3504]}
    {'France' }    {[23.6667]}    {[4.0711]}
    {'Sweden' }    {[22.5000]}    {[4.9860]}
    {'Italy'  }    {[     28]}    {[7.0513]}

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные взяты из исследования брендов попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами (Gourmet, National и Generic). Строки типа popper - нефть и воздух. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером. Значениями являются выражение в чашках попкорна.

Выполните двухсторонний Дисперсионный Анализ. Также вычислите статистику, которую необходимо выполнить для выполнения нескольких сравнительных тестов основных эффектов.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

The stats структура включает

  • Средняя квадратичная невязка (sigmasq)

  • Оценки среднего выражения для каждой марки попкорна (colmeans)

  • Количество наблюдений за каждой маркой попкорна (coln)

  • Оценка среднего выражения для каждого типа поппера (rowmeans)

  • Количество наблюдений для каждого типа popper (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значимости термина взаимодействия (pval)

  • Степени свободы ошибки (df).

Выполните многократный сравнительный тест, чтобы увидеть, отличается ли выражение попкорна между парами марок попкорна (столбцов).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of column means contains an axes. The axes with title Click on the group you want to test contains 7 objects of type line.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c показать группы, которые сравниваются. В четвертом столбце показано различие между предполагаемыми средними значениями группы. Третий и пятый столбцы показывают нижний и верхний пределы для 95% доверительных интервалов для истинного среднего различия. Шестой столбец содержит p-значение для критерия гипотезы, что соответствующее среднее различие равно нулю. Все значения p (0, 0 и 0,0116) очень малы, что указывает на то, что выражение попкорна отличается по всем трем маркам.

Рисунок показывает многократное сравнение средств. По умолчанию подсвечивается среднее значение группы 1, а интервал сравнения выделяется синим цветом. Поскольку интервалы сравнения для двух других групп не пересекаются с интервалами для среднего значения группы 1, они подсвечиваются красным цветом. Отсутствие пересечения указывает, что оба средства отличаются от среднего значения группы 1. Выберите другое средство группы, чтобы подтвердить, что все средства группы значительно отличаются друг от друга.

Выполните многократный сравнительный тест, чтобы увидеть, что выход попкорна отличается между двумя типами поппера (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of row means contains an axes. The axes with title Click on the group you want to test contains 5 objects of type line.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Малое значение p 0,0001 указывает, что выражение попкорна отличается между двумя типами поппера (воздух и масло). Рисунки показывают те же результаты. Несвязанные интервалы сравнения показывают, что групповые средства значительно отличаются друг от друга.

Загрузите выборочные данные.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

y - вектор отклика и g1, g2, и g3 являются сгруппированными переменными (факторами). Каждый фактор имеет два уровня и каждое наблюдение в y определяется комбинацией уровней факторов. Для примера, y(1) наблюдений связана с уровнем 1 фактора g1, уровни 'hi' фактора g2, и уровни 'may' фактора g3. Точно так же y(6) наблюдений связана с уровнем 2 фактора g1, уровни 'hi' фактора g2, и уровни 'june' фактора g3.

Проверьте, является ли реакция одинаковой для всех уровней факторов. Также вычислите статистику, необходимую для нескольких сравнительных тестов.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...
    'varnames',{'g1','g2','g3'});

Figure N-Way ANOVA contains objects of type uicontrol.

Значение p 0,2578 указывает, что средние отклики для уровней 'may' и 'june' фактора g3 существенно не отличаются. Значение p 0,0347 указывает, что средние отклики для уровней 1 и 2 фактора g1 значительно отличаются. Точно так же значение p 0,0048 указывает, что средние отклики для уровней 'hi' и 'lo' фактора g2 значительно отличаются.

Выполните несколько сравнительных тестов, чтобы выяснить, какие группы факторов g1 и g2 значительно отличаются.

results = multcompare(stats,'Dimension',[1 2])

Figure Multiple comparison of population marginal means contains an axes. The axes with title Click on the group you want to test contains 9 objects of type line.

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0272
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0170
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0136
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0101
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0087
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0737

multcompare сравнивает комбинации групп (уровней) двух сгруппированных переменных, g1 и g2. В results матрица, число 1 соответствует комбинации уровней 1 от g1 и уровни hi от g2, число 2 соответствует комбинации уровней 2 от g1 и уровни hi от g2. Точно так же число 3 соответствует комбинации уровней 1 от g1 и уровни lo от g2, и число 4 соответствует комбинации уровней 2 от g1 и уровни lo от g2. Последний столбец матрицы содержит p-значения.

Для примера первая строка матрицы показывает, что комбинация уровней 1 от g1 и уровни hi от g2 имеет те же средние значения отклика, что и комбинация 2 уровня от g1 и уровни hi от g2. Значение p, соответствующее этому тесту, составляет 0,0280, что указывает на то, что средние отклики значительно отличаются. Этот результат можно также увидеть на рисунке. Синяя полоса показывает интервал сравнения для средней характеристики для комбинации уровней 1 от g1 и уровни hi от g2. Красные полосы являются интервалами сравнения для среднего отклика для других комбинаций групп. Ни одна из красных полос не перекрывается с синей полоской, что означает среднюю характеристику для комбинации 1 уровня от g1 и уровни hi от g2 значительно отличается от среднего отклика для других групповых комбинаций.

Можно протестировать другие группы, щелкнув на соответствующем интервале сравнения для группы. Панель, на которой вы нажимаете, становится синей. Столбцы для групп, которые значительно отличаются, являются красными. Столбцы для групп, которые существенно не отличаются, являются серыми. Для примера, если вы кликните по интервалу сравнения для комбинации уровней 1 от g1 и уровни lo от g2, интервал сравнения для комбинации уровней 2 от g1 и уровни lo от g2 перекрывается, и поэтому является серым. И наоборот, другие интервалы сравнения являются красными, что указывает на значительное различие.

Входные параметры

свернуть все

Тестовые данные, заданные как структура. Вы можете создать структуру с помощью одной из следующих функций:

  • anova1 - Однофакторный дисперсионный анализ.

  • anova2 - Двухсторонний дисперсионный анализ.

  • anovan - N -сторонний дисперсионный анализ.

  • aoctool - Интерактивный анализ ковариационного инструмента.

  • friedman - Тест Фридмана.

  • kruskalwallis - тест Крускаля-Уоллиса.

multcompare не поддерживает несколько сравнений, используя anovan выход для модели, которая включает случайные или вложенные эффекты. Вычисления для модели случайных эффектов дают предупреждение, что все эффекты рассматриваются как фиксированные. Вложенные модели не принимаются.

Типы данных: struct

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Alpha',0.01,'CType','bonferroni','Display','off' вычисляет критические значения Бонферрони, проводит проверку гипотезы на уровне значимости 1% и опускает интерактивное отображение.

Уровень значимости теста многократного сравнения, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений (0,1). Значение, заданное для 'Alpha' определяет 100 × (1 - α) доверительные уровни интервалов, возвращаемых в матрицу c и на рисунке.

Пример: 'Alpha',0.01

Типы данных: single | double

Тип критического значения для многократного сравнения, заданный как разделенная разделенными запятой парами, состоящая из 'CType' и одно из следующих.

Пример: 'CType','bonferroni'

Отобразите переключатель, заданный как разделенная разделенными запятой парами, состоящая из 'Display' и любой из них 'on' или 'off'. Если вы задаете 'on', затем multcompare отображает график оценок и их интервалов сравнения. Если вы задаете 'off', затем multcompare опускает график.

Пример: 'Display','off'

Вектор, задающий размерность или размерности, по которым можно вычислить маргинальное значение населения, заданное в виде положительного целого числа, или вектор таких значений. Используйте 'Dimension' Пара "имя-значение" только, если вы создаете вход структуру stats использование функции anovan.

Для примера, если вы задаете 'Dimension' как 1, затем multcompare сравнивает средство для каждого значения первой сгруппированной переменной, скорректированное путем удаления эффектов других сгруппированных переменных так, как если бы проект был сбалансирован. Если вы задаете 'Dimension'как [1,3], затем multcompare вычисляет население предельные средства для каждой комбинации первых и третьих сгруппированных переменных, удаляя эффекты второй сгруппированной переменной. Если вы подбираете сингулярную модель, некоторые средства камеры могут быть не оценены, и любые маргинальные средства населения, которые зависят от этих средств камеры, будут иметь значение NaN.

Населения маргинальные средства описаны Милликеном и Джонсоном (1992) и Searle, Speed и Milliken (1980). Идея предельных средств для населения состоит в том, чтобы удалить любой эффект несбалансированного проекта путем фиксации значений факторов, заданных 'Dimension'и усреднение эффектов других факторов, как если бы каждая комбинация факторов происходила одинаковое количество раз. Определение маргинальных средств населения не зависит от количества наблюдений при каждой комбинации факторов. Для спроектированных экспериментов, где количество наблюдений в каждой комбинации факторов не имеет никакого значения, население маргинальные средства могут быть легче интерпретировать, чем простые способы получения игнорирующие другие факторы. Для обследований и других исследований, где количество наблюдений в каждой комбинации имеет смысл, маргинальные средства населения могут быть более трудными для интерпретации.

Пример: 'Dimension',[1,3]

Типы данных: single | double

Сравниваемые оценки, заданные как разделенная разделенными запятой парами, состоящая из 'Estimate' и допустимое значение. Допустимые значения для 'Estimate' зависят от функции, используемой для генерации структуры входа stats, согласно следующей таблице.

ИсточникЗначения
anova1

Ничего. Эта пара "имя-значение" игнорируется, и multcompare всегда сравнивает среднее значение группы.

anova2

Либо 'column' сравнить средние значения столбцов или 'row' сравнить строку средства.

anovan

Ничего. Эта пара "имя-значение" игнорируется, и multcompare всегда сравнивает маргинальные средства населения как задано в 'Dimension' аргумент пары "имя-значение".

aoctool

Либо 'slope', 'intercept', или 'pmm' сравнение склонов, точек пересечения или маргинальных средств населения, соответственно. Если анализ ковариационной модели не включал отдельные склоны, то 'slope' не разрешено. Если она не включала отдельных точек пересечения, то никакие сравнения не возможны.

friedman

Ничего. Эта пара "имя-значение" игнорируется, и multcompare всегда сравнивает средние ранги столбцов.

kruskalwallis

Ничего. Эта пара "имя-значение" игнорируется, и multcompare всегда сравнивает средние ранги групп.

Пример: 'Estimate','row'

Выходные аргументы

свернуть все

Матрица результатов многократного сравнения, возвращенная как p-на-6 матрица скалярных значений, где p - количество пар групп. Каждая строка матрицы содержит результат одного парного теста сравнения. Столбцы 1 и 2 содержат индексы двух сравниваемых выборок. Столбец 3 содержит нижний доверительный интервал, столбец 4 содержит оценку, а столбец 5 содержит верхний доверительный интервал. Столбец 6 содержит p-значение для теста гипотезы, что соответствующее среднее различие не равно 0.

Например, предположим, что одна строка содержит следующие записи.

2.0000  5.0000  1.9442  8.2206  14.4971 0.0432

Эти числа указывают, что среднее значение группы 2 за вычетом среднего значения группы 5 оценивается в 8,2206, и 95% доверительный интервал для истинного различия средств составляет [1.9442, 14.4971]. Значение p для соответствующего теста гипотезы, что различие средств групп 2 и 5 значительно отличается от нуля, составляет 0,0432.

В этом примере доверительный интервал не содержит 0, поэтому различие значимо на уровне 5% значимости. Если доверие интервал содержал 0, различие не была бы значительной. Значение p 0,0432 также указывает, что различие средств групп 2 и 5 значительно отличается от 0.

Матрица оценок, возвращенная как матрица скалярных значений. Первый столбец m содержит оценочные значения средств (или любых статистических данных, которые сравниваются) для каждой группы, а второй столбец содержит их стандартные ошибки.

Указатель на рисунок, содержащую интерактивный график, возвращаемый как указатель. Заголовок этого графика содержит инструкции для взаимодействия с графиком, а подпись по осям x-ось содержит информацию о том, какие средства значительно отличаются от выбранного среднего. Если вы планируете использовать этот график для представления, можно опустить заголовок и метку оси x. Можно удалить их с помощью интерактивных функций графика, или можно использовать следующие команды.

title('')
xlabel('')

Имена групп, возвращенные как массив ячеек из векторов символов. Каждая строка gnames содержит имя группы.

Подробнее о

свернуть все

Несколько сравнительных тестов

Анализ отклонения сравнивает средства нескольких групп, чтобы проверить гипотезу, что все они равны, против общей альтернативы, что они не все равны. Иногда эта альтернатива может быть слишком общей. Вам может понадобиться информация о том, какие пары средств значительно отличаются, а какие нет. Несколько сравнительных тестов могут предоставить эту информацию.

Когда вы выполняете простой t -тест среднего значения одной группы против другой, вы задаете уровень значимости, который определяет значение среза t -статистического. Для примера можно задать значение alpha = 0.05 чтобы страховать, что, когда нет реального различия, вы неправильно найдете существенное различие не более 5% времени. Когда существует много групповых средств, существует также много пар для сравнения. Если вы применили обыкновенный t-тест в этой ситуации, alpha значение будет применяться к каждому сравнению, поэтому вероятность неправильного нахождения существенного различия увеличится с количеством сравнений. Множественные процедуры сравнения разработаны, чтобы обеспечить верхнюю границу вероятности того, что любое сравнение будет неправильно найдено значительным.

Ссылки

[1] Hochberg, Y., and A. C. Tamhane. Множественные процедуры сравнения. Hoboken, NJ: John Wiley & Sons, 1987.

[2] Милликен, Г. А. и Д. Э. Джонсон. Анализ данных Messy, том I: Разработанные эксперименты. Бока Ратон, FL: Chapman & Hall/CRC Press, 1992.

[3] Searle, S. R., F. M. Speed, and G. A. Milliken. «Граничное население означает в линейной модели: альтернатива малым квадратам означает». Американский статистик. 1980, стр 216–221.

См. также

| | | | |

Представлено до R2006a