multcompare

Несколько тест сравнения

Описание

пример

c = multcompare(stats) возвращает матричный c из попарного сравнения следует из теста сравнения кратного с помощью информации, содержавшейся в stats структура. multcompare также отображает интерактивный график интервалов сравнения и оценок. Каждое среднее значение группы представлено символом, и интервал представлен линией, расширяющей от символа. Два средних значения группы существенно отличаются, если их интервалы являются непересекающимися; они не существенно отличаются, если их интервалы перекрываются. Если вы будете использовать свою мышь, чтобы выбрать какую-либо группу, то график подсветит все другие группы, которые существенно отличаются, если таковые имеются.

пример

c = multcompare(stats,Name,Value) возвращает матрицу попарных результатов сравнения, c, использование дополнительных опций задано одним или несколькими Name,Value парные аргументы. Например, можно задать доверительный интервал или тип критического значения, чтобы использовать в нескольких сравнение.

[c,m] = multcompare(___) также возвращает матрицу, m, который содержит ориентировочные стоимости средних значений (или независимо от того, что статистические данные сравниваются) для каждой группы и соответствующих стандартных погрешностей. Можно использовать любой из предыдущих синтаксисов.

[c,m,h] = multcompare(___) также возвращает указатель, h, к графику сравнения.

пример

[c,m,h,gnames] = multcompare(___) также возвращает массив ячеек, gnames, который содержит имена групп.

Примеры

свернуть все

Загрузите выборочные данные.

load carsmall

Выполните односторонний дисперсионный анализ (Дисперсионный Анализ), чтобы видеть, существует ли какое-либо различие между пробегом автомобилей источником.

[p,t,stats] = anova1(MPG,Origin,'off');

Выполните сравнение кратного средних значений группы.

[c,m,h,nms] = multcompare(stats);

multcompare отображает оценки с интервалами сравнения вокруг них. Можно кликнуть по графикам каждой страны, чтобы сравнить ее среднее значение с теми из других стран.

Теперь отобразите средние оценки и стандартные погрешности с соответствующими названиями группы.

[nms num2cell(m)]
ans=6×3 cell array
    {'USA'    }    {[21.1328]}    {[0.8814]}
    {'Japan'  }    {[31.8000]}    {[1.8206]}
    {'Germany'}    {[28.4444]}    {[2.3504]}
    {'France' }    {[23.6667]}    {[4.0711]}
    {'Sweden' }    {[22.5000]}    {[4.9860]}
    {'Italy'  }    {[     28]}    {[7.0513]}

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn бренды (Gourmet, National, и Типовой). Строки являются нефтью типов кнопки и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой. Значения являются урожаем в чашках вытолканного попкорна.

Выполните двухсторонний Дисперсионный Анализ. Также вычислите статистику, что необходимо выполнить тест сравнения кратного на основных эффектах.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

stats структура включает

  • Среднеквадратическая ошибка (sigmasq)

  • Оценки среднего урожая для каждого бренда попкорна (colmeans)

  • Количество наблюдений для каждого бренда попкорна (coln)

  • Оценка среднего урожая для каждого типа кнопки (rowmeans)

  • Количество наблюдений для каждого типа кнопки (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значения периода взаимодействия (pval)

  • Ошибочные степени свободы (df).

Выполните тест сравнения кратного, чтобы видеть, отличается ли урожай попкорна между парами брендов попкорна (столбцы).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c покажите группы, которые сравнены. Четвертый столбец показывает различие между предполагаемыми средними значениями группы. Третьи и пятые колонны показывают нижние и верхние пределы для 95% доверительных интервалов для истинного среднего расхождения. Шестой столбец содержит p-значение для теста гипотезы, который равно нулю соответствующее среднее расхождение. Все p-значения (0, 0, и 0.0116) очень малы, который указывает, что урожай попкорна отличается через все три бренда.

Рисунок показывает несколько сравнение средних значений. По умолчанию среднее значение группы 1 подсвечено, и интервал сравнения находится в синем. Поскольку интервалы сравнения для других двух групп не пересекаются с интервалами для среднего значения группы 1, они подсвечены в красном. Это отсутствие пересечения указывает, что оба средних значения отличаются, чем среднее значение группы 1. Выберите другие средние значения группы, чтобы подтвердить, что все средние значения группы существенно отличаются друг от друга.

Выполните тест сравнения кратного, чтобы видеть, что попкорн уступить отличается между двумя типами кнопки (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Маленькое p-значение 0,0001 указывает, что урожай попкорна отличается между двумя типами кнопки (воздух и нефть). Рисунок показывает те же результаты. Непересекающиеся интервалы сравнения указывают, что средние значения группы существенно отличаются друг от друга.

Загрузите выборочные данные.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

y вектор отклика и g1, g2, и g3 сгруппированные переменные (факторы). Каждый фактор имеет два уровня и каждое наблюдение в y идентифицирован комбинацией факторных уровней. Например, наблюдение y(1) сопоставлен с уровнем 1 факторного g1, уровень 'hi' из факторного g2, и уровень 'may' из факторного g3. Точно так же наблюдение y(6) сопоставлен с уровнем 2 факторного g1, уровень 'hi' из факторного g2, и уровень 'june' из факторного g3.

Протестируйте, если ответ является тем же самым для всех факторных уровней. Также вычислите статистику, требуемую для нескольких тестов сравнения.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...
    'varnames',{'g1','g2','g3'});

P-значение 0,2578 указывает что средние ответы для уровней 'may' и 'june' из факторного g3 не существенно отличаются. P-значение 0,0347 указывает что средние ответы для уровней 1 и 2 из факторного g1 существенно отличаются. Точно так же p-значение 0,0048 указывает что средние ответы для уровней 'hi' и 'lo' из факторного g2 существенно отличаются.

Выполните несколько тестов сравнения, чтобы узнать который группы факторов g1 и g2 существенно отличаются.

results = multcompare(stats,'Dimension',[1 2])

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0280
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0177
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0143
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0108
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0095
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0745

multcompare сравнивает комбинации групп (уровни) этих двух сгруппированных переменных, g1 и g2. В results матрица, номер 1 соответствует комбинации уровня 1 из g1 и уровень hi из g2, номер 2 соответствует комбинации уровня 2 из g1 и уровень hi из g2. Точно так же номер 3 соответствует комбинации уровня 1 из g1 и уровень lo из g2, и номер 4 соответствует комбинации уровня 2 из g1 и уровень lo из g2. Последний столбец матрицы содержит p-значения.

Например, первая строка матрицы показывает что комбинация уровня 1 из g1 и уровень hi из g2 имеет те же средние значения ответа как комбинация уровня 2 из g1 и уровень hi из g2. P-значение, соответствующее этому тесту, 0.0280, который указывает, что средние ответы существенно отличаются. Можно также видеть этот результат в фигуре. Синяя панель показывает интервал сравнения для среднего ответа для комбинации уровня 1 из g1 и уровень hi из g2. Красные панели являются интервалами сравнения для среднего ответа для других комбинаций группы. Ни одна из красных панелей не перекрывается с синей панелью, что означает средний ответ для комбинации уровня 1 из g1 и уровень hi из g2 существенно отличается от среднего ответа для других комбинаций группы.

Можно протестировать другие группы путем нажатия на соответствующий интервал сравнения для группы. Панель вы нажимаете на повороты к синему. Панели для групп, которые существенно отличаются, являются красными. Панели для групп, которые не существенно отличаются, являются серыми. Например, если вы нажимаете на интервал сравнения для комбинации уровня 1 из g1 и уровень lo из g2, интервал сравнения для комбинации уровня 2 из g1 и уровень lo из g2 перекрытия, и являются поэтому серыми. С другой стороны другие интервалы сравнения являются красными, указывая на значительную разницу.

Входные параметры

свернуть все

Тестовые данные в виде структуры. Можно создать структуру с помощью одной из следующих функций:

  • anova1 — Односторонний дисперсионный анализ.

  • anova2 — Двухсторонний дисперсионный анализ.

  • anovanN - путь дисперсионный анализ.

  • aoctool — Интерактивный инструмент ковариационного анализа.

  • friedman — Тест Фридмана.

  • kruskalwallis — Тест Краскэл-Уоллиса.

multcompare не поддерживает несколько сравнений с помощью anovan выведите для модели, которая включает случайные или вложенные эффекты. Вычисления для случайные эффекты продукт модели предупреждение, что все эффекты обработаны, как зафиксировано. Вложенные модели не приняты.

Типы данных: struct

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Alpha',0.01,'CType','bonferroni','Display','off' вычисляет критические значения Bonferroni, проводит тесты гипотезы на 1%-м уровне значения и не использует интерактивное отображение.

Уровень значения нескольких тест сравнения в виде разделенной запятой пары, состоящей из 'Alpha' и скалярное значение в области значений (0,1). Значение задано для 'Alpha' определяет 100 × (1 – α) доверительные уровни интервалов, возвращенных в матричном c и в фигуре.

Пример: 'Alpha',0.01

Типы данных: single | double

Тип критического значения, чтобы использовать в нескольких сравнение в виде разделенной запятой пары, состоящей из 'CType' и одно из следующих.

Пример: 'CType','bonferroni'

Отобразите переключатель в виде разделенной запятой пары, состоящей из 'Display' и любой 'on' или 'off'. Если вы задаете 'on', затем multcompare отображает график оценок и их интервалов сравнения. Если вы задаете 'off', затем multcompare не использует график.

Пример: 'Display','off'

Вектор, задающий размерность или размерности, по которым можно вычислить крайнее население, означает в виде положительного целочисленного значения или вектора таких значений. Используйте 'Dimension' пара "имя-значение", только если вы создаете входную структуру stats использование функционального anovan.

Например, если вы задаете 'Dimension' как 1, затем multcompare сравнивает средние значения для каждого значения первой сгруппированной переменной, настроенной путем удаления эффектов других сгруппированных переменных, как будто проект был сбалансирован. Если вы задаете 'Dimension'как [1,3], затем multcompare вычисляет население крайние средние значения для каждой комбинации первых и третьих сгруппированных переменных, удаляя эффекты второй сгруппированной переменной. Если вы подбираете сингулярную модель, некоторые средние значения ячейки не могут быть допускающими оценку и никакое население крайние средние значения, которые зависят от тех средних значений ячейки, будет иметь значение NaN.

Население крайние средние значения описано Милликругозором и Джонсоном (1992) и Сирлом, Скоростью и Милликругозором (1980). Идея позади населения крайние средние значения состоит в том, чтобы удалить любой эффект несбалансированного проекта путем фиксации значений факторов, заданных 'Dimension', и составление в среднем эффектов других факторов, как будто каждая факторная комбинация произошла то же число раз. Определение населения крайние средние значения не зависит от количества наблюдений в каждой факторной комбинации. Для спроектированных экспериментов, где количество наблюдений в каждой факторной комбинации не имеет никакого значения, население, крайние средние значения может быть легче интерпретировать, чем простые способы получения, игнорирующие другие факторы. Для обзоров и других исследований, где количество наблюдений в каждой комбинации действительно имеет значение, население, крайние средние значения может быть более трудно интерпретировать.

Пример: 'Dimension',[1,3]

Типы данных: single | double

Оценки, которые будут сравнены в виде разделенной запятой пары, состоящей из 'Estimate' и допустимое значение. Допустимые значения для 'Estimate' зависьте от функции, используемой, чтобы сгенерировать входную структуру stats, согласно следующей таблице.

ИсточникЗначения
anova1

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние значения группы.

anova2

Любой 'column' сравнить средние значения столбца или 'row' сравнить средние значения строки.

anovan

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает население крайние средние значения, как задано 'Dimension' аргумент пары "имя-значение".

aoctool

Любой 'slope', 'intercept', или 'pmm' сравнить наклоны, прерывания или население крайние средние значения, соответственно. Если модель ковариационного анализа не включала отдельные наклоны, то 'slope' не позволен. Если это не включало отдельные прерывания, то никакие сравнения не возможны.

friedman

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние ранги столбца.

kruskalwallis

'none'. Эта пара "имя-значение" проигнорирована, и multcompare всегда сравнивает средние ранги группы.

Пример: 'Estimate','row'

Выходные аргументы

свернуть все

Матрица нескольких результатов сравнения, возвращенных как p-by-6 матрица скалярных значений, где p является количеством пар групп. Каждая строка матрицы содержит результат одного теста парного сравнения. Столбцы 1 и 2 содержат индексы этих двух сравниваемых выборок. Столбец 3 содержит более низкий доверительный интервал, столбец 4 содержит оценку, и столбец 5 содержит верхний доверительный интервал. Столбец 6 содержит p - значение для теста гипотезы, что соответствующее среднее расхождение не равно 0.

Например, предположите, что одна строка содержит следующие записи.

2.0000  5.0000  1.9442  8.2206  14.4971 0.0432

Эти числа указывают, что среднее значение группы 2 минус среднее значение группы 5, как оценивается, 8.2206, и 95%-й доверительный интервал для истинного различия средних значений [1.9442, 14.4971]. p - значение для соответствующего теста гипотезы, что различие средних значений групп 2 и 5 существенно отличается от нуля, 0.0432.

В этом примере доверительный интервал не содержит 0, таким образом, различие является значительным на 5%-м уровне значения. Если бы доверительный интервал действительно содержал 0, различие не было бы значительным. p - значение 0,0432 также указывает, что различие средних значений групп 2 и 5 существенно отличается от 0.

Матрица оценок, возвращенных как матрица скалярных значений. Первый столбец m содержит ориентировочные стоимости средних значений (или независимо от того, что статистические данные сравниваются) для каждой группы, и второй столбец содержит их стандартные погрешности.

Обработайте к фигуре, содержащей интерактивный график, возвращенный как указатель. Заголовок этого графика содержит инструкции для взаимодействия с графиком и x - подпись по осям содержит информацию о том, что означает, существенно отличаются от выбранного среднего значения. Если вы планируете использовать этот график в представлении, можно хотеть не использовать заголовок и x - подпись по осям. Можно удалить их использующий интерактивные функции окна графика, или можно использовать следующие команды.

title('')
xlabel('')

Названия группы, возвращенные как массив ячеек из символьных векторов. Каждая строка gnames содержит имя группы.

Больше о

свернуть все

Несколько тестов сравнения

Дисперсионный анализ сравнивает средние значения нескольких групп, чтобы протестировать гипотезу, что они все равны против общей альтернативы, что они не все равны. Иногда эта альтернатива может быть слишком общей. Вам, возможно, понадобится информация, о которой пары средних значений существенно отличаются, и которые не являются. Тест сравнения кратного может предоставить эту информацию.

Когда вы выполняете простой t - тест одного среднего значения группы против другого, вы задаете уровень значения, который определяет значение сокращения t - статистическая величина. Например, можно задать значение alpha= 0.05  обеспечить, чтобы, когда не будет никакой реальной разницы, вы неправильно нашли значительную разницу не больше, чем 5% времени. Когда существует много средних значений группы, существует также много пар, чтобы выдержать сравнение. Если вы применялись, обычный t - тестируют в этой ситуации, alpha значение применилось бы к каждому сравнению, таким образом, шанс неправильного нахождения значительной разницы увеличится с количеством сравнений. Несколько процедур сравнения спроектированы, чтобы обеспечить верхнюю границу на вероятности, что любое сравнение будет неправильно найдено значительным.

Ссылки

[1] Hochberg, Y. и А. К. Тамхэйн. Несколько процедур сравнения. Хобокен, NJ: John Wiley & Sons, 1987.

[2] Милликругозор, G. A. и Д. Э. Джонсон. Анализ грязных данных, объем I: спроектированные эксперименты. Бока-Ратон, FL: Chapman & Hall/CRC Press, 1992.

[3] Сирл, S. R. Ф. М. Спид и Г. А. Милликен. “Крайнее население означает в линейной модели: альтернатива средним значениям наименьших квадратов”. Американский Статистик. 1980, стр 216–221.

Смотрите также

| | | | |

Представлено до R2006a