multcompare

Несколько тест сравнения

Синтаксис

c = multcompare(stats)
c = multcompare(stats,Name,Value)
[c,m] = multcompare(___)
[c,m,h] = multcompare(___)
[c,m,h,gnames] = multcompare(___)

Описание

пример

c = multcompare(stats) возвращается матричный c попарного сравнения следует из теста сравнения кратного с помощью информации, содержавшейся в структуре stats. multcompare также отображает интерактивный график интервалов сравнения и оценок. Каждое среднее значение группы представлено символом, и интервал представлен строкой, расширяющей от символа. Два средних значения группы существенно отличаются, если их интервалы являются непересекающимися; они не существенно отличаются, если их интервалы накладываются. Если вы будете использовать свою мышь, чтобы выбрать какую-либо группу, то график подсветит все другие группы, которые существенно отличаются, если таковые имеются.

пример

c = multcompare(stats,Name,Value) возвращает матрицу попарных результатов сравнения, c, с помощью дополнительных опций, заданных одним или несколькими аргументами пары Name,Value. Например, можно задать доверительный интервал или тип критического значения, чтобы использовать в нескольких сравнение.

[c,m] = multcompare(___) также возвращает матрицу, m, который содержит ориентировочные стоимости средних значений (или независимо от того, что статистические данные сравниваются) для каждой группы и соответствующих стандартных погрешностей. Можно использовать любой из предыдущих синтаксисов.

[c,m,h] = multcompare(___) также возвращает указатель, h, к графику сравнения.

пример

[c,m,h,gnames] = multcompare(___) также возвращает массив ячеек, gnames, который содержит имена групп.

Примеры

свернуть все

Загрузите выборочные данные.

load carsmall

Выполните односторонний дисперсионный анализ (АНОВА), чтобы видеть, существует ли какое-либо различие между пробегом автомобилей источником.

[p,t,stats] = anova1(MPG,Origin,'off');

Выполните сравнение кратного средних значений группы.

[c,m,h,nms] = multcompare(stats);

multcompare отображает оценки с интервалами сравнения вокруг них. Можно кликнуть по графикам каждой страны, чтобы сравнить ее среднее значение с теми из других стран.

Теперь отобразите средние оценки и стандартные погрешности с соответствующими названиями группы.

[nms num2cell(m)]
ans = 6x3 cell array
    {'USA'    }    {[21.1328]}    {[0.8814]}
    {'Japan'  }    {[31.8000]}    {[1.8206]}
    {'Germany'}    {[28.4444]}    {[2.3504]}
    {'France' }    {[23.6667]}    {[4.0711]}
    {'Sweden' }    {[22.5000]}    {[4.9860]}
    {'Italy'  }    {[     28]}    {[7.0513]}

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn являются брендами (Gourmet, National, и Типичный). Строки являются нефтью типов кнопки и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой. Значения являются урожаем в чашках вытолканного попкорна.

Выполните двухстороннюю АНОВУ. Также вычислите статистику, что необходимо выполнить тест сравнения кратного на основных эффектах.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

Структура stats включает

  • Среднеквадратическая ошибка (sigmasq)

  • Оценки среднего урожая для каждого бренда попкорна (colmeans)

  • Количество наблюдений для каждого бренда попкорна (coln)

  • Оценка среднего урожая для каждого типа кнопки (rowmeans)

  • Количество наблюдений для каждого типа кнопки (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значения периода взаимодействия (pval)

  • Ошибочные степени свободы (df).

Выполните тест сравнения кратного, чтобы видеть, отличается ли урожай попкорна между парами брендов попкорна (столбцы).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c показывают группы, которые сравнены. Четвертый столбец показывает различие между предполагаемыми средними значениями группы. Третьи и пятые колонны показывают нижние и верхние пределы для 95% доверительных интервалов для истинного среднего расхождения. Шестой столбец содержит p-значение для теста гипотезы, который равно нулю соответствующее среднее расхождение. Все p-значения (0, 0, и 0.0116) являются очень маленькими, который указывает, что урожай попкорна отличается через все три бренда.

Данные показывают несколько сравнение средних значений. По умолчанию среднее значение группы 1 подсвечено, и интервал сравнения находится в синем. Поскольку интервалы сравнения для других двух групп не пересекаются с интервалами для среднего значения группы 1, они подсвечены в красном. Это отсутствие пересечения указывает, что оба средних значения отличаются, чем среднее значение группы 1. Выберите другие средние значения группы, чтобы подтвердить, что все средние значения группы существенно отличаются друг от друга.

Выполните тест сравнения кратного, чтобы видеть, что попкорн уступить отличается между двумя типами кнопки (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Маленькое p-значение 0,0001 указывает, что урожай попкорна отличается между двумя типами кнопки (воздух и нефть). Данные показывают те же результаты. Непересекающиеся интервалы сравнения указывают, что средние значения группы существенно отличаются друг от друга.

Загрузите выборочные данные.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

y является вектором отклика и g1, g2, и g3 является группирующими переменными (факторы). Каждый фактор имеет два уровня, и каждое наблюдение в y идентифицировано комбинацией факторных уровней. Например, наблюдение y(1) сопоставлено с уровнем 1 факторного g1, уровень 'hi' факторного g2 и уровень 'may' факторного g3. Точно так же наблюдение y(6) сопоставлено с уровнем 2 факторного g1, уровень 'hi' факторного g2 и уровень 'june' факторного g3.

Протестируйте, если ответ является тем же самым для всех факторных уровней. Также вычислите статистику, требуемую для нескольких тестов сравнения.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...
    'varnames',{'g1','g2','g3'});

P-значение 0,2578 указывает, что средние ответы для уровней 'may' и 'june' факторного g3 не существенно отличаются. P-значение 0,0347 указывает, что средние ответы для уровней 1 и 2 факторного g1 существенно отличаются. Точно так же p-значение 0,0048 указывает, что средние ответы для уровней 'hi' и 'lo' факторного g2 существенно отличаются.

Выполните несколько тестов сравнения, чтобы узнать, какие группы факторов g1 и g2 существенно отличаются.

results = multcompare(stats,'Dimension',[1 2])

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0280
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0177
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0143
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0108
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0095
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0745

multcompare сравнивает комбинации групп (уровни) этих двух группирующих переменных, g1 и g2. В матрице results номер 1 соответствует комбинации уровня 1 g1 и уровня hi g2, номер 2 соответствует комбинации уровня 2 g1 и уровня hi g2. Точно так же номер 3 соответствует комбинации уровня 1 g1 и уровня lo g2, и номер 4 соответствует комбинации уровня 2 g1 и уровня lo g2. Последний столбец матрицы содержит p-значения.

Например, первая строка матрицы показывает, что комбинация уровня 1 g1 и уровня hi g2 имеет те же средние значения ответа как комбинация уровня 2 g1 и уровня hi g2. P-значение, соответствующее этому тесту, 0.0280, который указывает, что средние ответы существенно отличаются. Можно также видеть этот результат в фигуре. Синяя панель показывает интервал сравнения для среднего ответа для комбинации уровня 1 g1 и уровня hi g2. Красные панели являются интервалами сравнения для среднего ответа для других комбинаций группы. Ни одна из красных панелей не накладывается с синей панелью, что означает средний ответ для комбинации уровня 1 g1 и уровня, hi g2 существенно отличается от среднего ответа для других комбинаций группы.

Можно протестировать другие группы путем нажатия на соответствующий интервал сравнения для группы. Панель вы нажимаете на повороты к синему. Панели для групп, которые существенно отличаются, являются красными. Панели для групп, которые не существенно отличаются, являются серыми. Например, если вы нажимаете на интервал сравнения для комбинации уровня 1 g1 и уровня lo g2, интервала сравнения для комбинации уровня 2 g1 и уровня lo перекрытий g2, и является поэтому серым. С другой стороны другие интервалы сравнения являются красными, указывая на значительную разницу.

Входные параметры

свернуть все

Тестовые данные, заданные как структура. Можно создать структуру с помощью одной из следующих функций:

  • anova1 — Односторонний дисперсионный анализ.

  • anova2 — Двухсторонний дисперсионный анализ.

  • anovanN - путь дисперсионный анализ.

  • aoctool — Интерактивный инструмент ковариационного анализа.

  • friedman — Тест Фридмана.

  • kruskalwallis — Тест Краскэл-Уоллиса.

multcompare не поддерживает несколько сравнений с помощью anovan вывод для модели, которая включает случайные или вложенные эффекты. Вычисления для случайные эффекты образцовый продукт предупреждение, что все эффекты обработаны, как зафиксировано. Вложенные модели не приняты.

Типы данных: struct

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'CType','bonferroni','Display','off' вычисляет критические значения Bonferroni, проводит тесты гипотезы на 1%-м уровне значения и не использует интерактивное отображение.

Уровень значения нескольких тест сравнения, заданный как пара, разделенная запятой, состоящая из 'Alpha' и скалярного значения в области значений (0,1). Значение, заданное для 'Alpha', определяет 100 × (1 – α) доверительные уровни интервалов, возвращенных в матричном c и в фигуре.

Пример: 'Alpha',0.01

Типы данных: single | double

Тип критического значения, чтобы использовать для нескольких сравнение, заданное как пара, разделенная запятой, состоящая из 'CType' и одно из следующих.

Пример: 'CType','bonferroni'

Отобразите переключатель, заданный как пара, разделенная запятой, состоящая из 'Display' и или 'on' или 'off'. Если вы задаете 'on', то multcompare отображает график оценок и их интервалов сравнения. Если вы задаете 'off', то multcompare не использует график.

Пример: 'Display','off'

Вектор, задающий размерность или размерности, по которым можно вычислить генеральную совокупность крайние средние значения, заданные как положительное целочисленное значение или вектор таких значений. Используйте пару "имя-значение" 'Dimension', только если вы создаете входную структуру stats с помощью функционального anovan.

Например, если вы задаете 'Dimension' как 1, затем multcompare сравнивает средние значения для каждого значения первой группирующей переменной, настроенной путем удаления эффектов других группирующих переменных, как будто проект был сбалансирован. Если вы задаете 'Dimension' как [1,3], то multcompare вычисляет генеральную совокупность крайние средние значения для каждой комбинации первых и третьих группирующих переменных, удаляя эффекты второй группирующей переменной. Если вы соответствуете сингулярной модели, некоторые средние значения ячейки не могут быть допускающими оценку и никакая генеральная совокупность крайние средние значения, которые зависят от тех средних значений ячейки, будет иметь значение NaN.

Генеральная совокупность крайние средние значения описана Милликругозором и Джонсоном (1992) и Сирлом, Скоростью и Милликругозором (1980). Идея позади генеральной совокупности, крайние средние значения должны удалить любой эффект несбалансированного проекта путем фиксации значений факторов, заданных 'Dimension' и составления в среднем эффекты других факторов, как будто каждая факторная комбинация произошла то же число раз. Определение генеральной совокупности крайние средние значения не зависит от количества наблюдений в каждой факторной комбинации. Для разработанных экспериментов, где количество наблюдений в каждой факторной комбинации не имеет никакого значения, генеральная совокупность, крайние средние значения может быть легче интерпретировать, чем простые способы получения, игнорирующие другие факторы. Для обзоров и других исследований, где количество наблюдений в каждой комбинации действительно имеет значение, генеральная совокупность, крайние средние значения может быть более трудно интерпретировать.

Пример: 'Dimension',[1,3]

Типы данных: single | double

Оценки, которые будут сравнены, заданные как пара, разделенная запятой, состоящая из 'Estimate' и допустимого значения. Допустимые значения для 'Estimate' зависят от функции, используемой, чтобы сгенерировать входную структуру stats, согласно следующей таблице.

ИсточникЗначения
anova1

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние значения группы.

anova2

Или 'column', чтобы сравнить средние значения столбца или 'row', чтобы сравнить средние значения строки.

anovan

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает генеральную совокупность крайние средние значения, как задано аргументом пары "имя-значение" 'Dimension'.

aoctool

Или 'slope', 'intercept' или 'pmm', чтобы сравнить наклоны, прерывания или генеральную совокупность крайние средние значения, соответственно. Если модель ковариационного анализа не включала отдельные наклоны, то 'slope' не позволен. Если это не включало отдельные прерывания, то никакие сравнения не возможны.

friedman

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние ранги столбца.

kruskalwallis

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние ранги группы.

Пример: 'Estimate','row'

Выходные аргументы

свернуть все

Матрица нескольких результатов сравнения, возвращенных как p-by-6 матрица скалярных значений, где p является количеством пар групп. Каждая строка матрицы содержит результат одного теста парного сравнения. Столбцы 1 и 2 содержат индексы этих двух сравниваемых выборок. Столбец 3 содержит более низкий доверительный интервал, столбец 4 содержит оценку, и столбец 5 содержит верхний доверительный интервал. Столбец 6 содержит p - значение для теста гипотезы, что соответствующее среднее расхождение не равно 0.

Например, предположите, что одна строка содержит следующие записи.

2.0000  5.0000  1.9442  8.2206  14.4971 0.0432

Эти числа указывают, что среднее значение группы 2 минус среднее значение группы 5, как оценивается, 8.2206, и 95%-й доверительный интервал для истинного различия средних значений [1.9442, 14.4971]. p - значение для соответствующего теста гипотезы, что различие средних значений групп 2 и 5 существенно отличается от нуля, 0.0432.

В этом примере доверительный интервал не содержит 0, таким образом, различие является значительным на 5%-м уровне значения. Если бы доверительный интервал действительно содержал 0, различие не было бы значительным. p - значение 0,0432 также указывает, что различие средних значений групп 2 и 5 существенно отличается от 0.

Матрица оценок, возвращенных как матрица скалярных значений. Первый столбец m содержит ориентировочные стоимости средних значений (или независимо от того, что статистические данные сравниваются) для каждой группы, и второй столбец содержит их стандартные погрешности.

Обработайте к фигуре, содержащей интерактивный график, возвращенный как указатель. Заголовок этого графика содержит инструкции для взаимодействия с графиком и x - подпись по осям содержит информацию о том, что означает, существенно отличаются от выбранного среднего значения. Если вы планируете использовать этот график для представления, можно хотеть не использовать заголовок и x - подпись по осям. Можно удалить их использующий интерактивные функции окна графика, или можно использовать следующие команды.

title('')
xlabel('')

Названия группы, возвращенные как массив ячеек из символьных векторов. Каждая строка gnames содержит имя группы.

Больше о

свернуть все

Несколько тестов сравнения

Дисперсионный анализ сравнивает средние значения нескольких групп, чтобы протестировать гипотезу, что они все равны против общей альтернативы, что они не все равны. Иногда эта альтернатива может быть слишком общей. Вам, возможно, понадобится информация, о которой пары средних значений существенно отличаются, и которые не являются. Тест сравнения кратного может предоставить эту информацию.

Когда вы выполняете простой t - тест одного среднего значения группы против другого, вы задаете уровень значения, который определяет значение сокращения t - статистическая величина. Например, можно задать значение alpha = 0.05, чтобы обеспечить что, когда не будет никакой реальной разницы, вы неправильно найдете значительную разницу не больше, чем 5% времени. Когда существует много средних значений группы, существует также много пар, чтобы выдержать сравнение. Если бы вы применялись, обычный t - тестируют в этой ситуации, значение alpha применилось бы к каждому сравнению, таким образом, шанс неправильного нахождения значительной разницы увеличится с количеством сравнений. Несколько процедур сравнения разработаны, чтобы обеспечить верхнюю границу на вероятности, что любое сравнение будет неправильно найдено значительным.

Ссылки

[1] Hochberg, Y. и А. К. Тамхэйн. Несколько процедур сравнения. Хобокен, NJ: John Wiley & Sons, 1987.

[2] Милликругозор, G. A. и Д. Э. Джонсон. Анализ грязных данных, объем I: разработанные эксперименты. Бока-Ратон, FL: Chapman & Hall/CRC Press, 1992.

[3] Сирл, S. R. Ф. М. Спид и Г. А. Милликен. “Крайняя генеральная совокупность имеет в виду в линейной модели: альтернатива средним значениям наименьших квадратов”. Американский Статистик. 1980, стр 216–221.

Смотрите также

| | | | |

Представлено до R2006a