Тест множественного сравнения
возвращает матрицу c = multcompare(stats)c результатов парного сравнения из множественного теста сравнения с использованием информации, содержащейся в stats структура. multcompare также отображает интерактивный график оценок и интервалов сравнения. Каждое групповое среднее представлено символом, а интервал представлен линией, отходящей от символа. Два групповых средства существенно различаются, если их интервалы разъединены; они существенно не отличаются, если их интервалы перекрываются. Если выбрать любую группу с помощью мыши, график выделит все другие группы, которые значительно отличаются друг от друга, если таковые имеются.
возвращает матрицу результатов попарного сравнения, c = multcompare(stats,Name,Value)c, используя дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары. Например, можно указать доверительный интервал или тип критического значения для использования при многократном сравнении.
Загрузите образцы данных.
load carsmallВыполните односторонний анализ отклонений (ANOVA), чтобы выяснить, существует ли какая-либо разница между пробегом автомобилей по происхождению.
[p,t,stats] = anova1(MPG,Origin,'off');Выполните многократное сравнение средств группы.
[c,m,h,nms] = multcompare(stats);

multcompare отображает оценки с интервалами сравнения вокруг них. Можно щелкнуть графики каждой страны, чтобы сравнить ее средние значения с данными других стран.
Теперь просмотрите средние оценки и стандартные ошибки с соответствующими именами групп.
[nms num2cell(m)]
ans=6×3 cell array
{'USA' } {[21.1328]} {[0.8814]}
{'Japan' } {[31.8000]} {[1.8206]}
{'Germany'} {[28.4444]} {[2.3504]}
{'France' } {[23.6667]} {[4.0711]}
{'Sweden' } {[22.5000]} {[4.9860]}
{'Italy' } {[ 28]} {[7.0513]}
Загрузите образцы данных.
load popcorn
popcornpopcorn = 6×3
5.5000 4.5000 3.5000
5.5000 4.5000 4.0000
6.0000 4.0000 3.0000
6.5000 5.0000 4.0000
7.0000 5.5000 5.0000
7.0000 5.0000 4.5000
Данные взяты из исследования марок попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами (Gourmet, National и Generic). Строки представляют собой масло и воздух хлопкового типа. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером. Значения представляют собой выход в чашках попкорна.
Выполнить двустороннюю ANOVA. Также вычислите статистику, необходимую для выполнения множественного теста сравнения основных эффектов.
[~,~,stats] = anova2(popcorn,3,'off')stats = struct with fields:
source: 'anova2'
sigmasq: 0.1389
colmeans: [6.2500 4.7500 4]
coln: 6
rowmeans: [4.5000 5.5000]
rown: 9
inter: 1
pval: 0.7462
df: 12
stats структура включает в себя
Средняя квадратичная ошибка (sigmasq)
Оценки средней доходности для каждой марки попкорна (colmeans)
Количество наблюдений за каждой маркой попкорна (coln)
Оценка среднего выхода для каждого типа поппера (rowmeans)
Количество наблюдений для каждого типа поппера (rown)
Количество взаимодействий (inter)
P-значение, показывающее уровень значимости члена взаимодействия (pval)
Степени свободы ошибок (df).
Выполните несколько сравнительных тестов, чтобы выяснить, отличается ли выход попкорна между парами марок попкорна (колонки).
c = multcompare(stats)
Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions.

c = 3×6
1.0000 2.0000 0.9260 1.5000 2.0740 0.0000
1.0000 3.0000 1.6760 2.2500 2.8240 0.0000
2.0000 3.0000 0.1760 0.7500 1.3240 0.0116
Первые два столбца c показать сравниваемые группы. В четвертом столбце показана разница между оцененными значениями группы. Третий и пятый столбцы показывают нижний и верхний пределы для 95% доверительных интервалов для истинной средней разницы. Шестой столбец содержит p-значение для проверки гипотезы, что соответствующая средняя разность равна нулю. Все значения p (0, 0 и 0,0116) очень малы, что указывает на то, что выход попкорна различается для всех трех марок.
На рисунке показано многократное сравнение средств. По умолчанию среднее значение группы 1 выделено, а интервал сравнения - синим. Поскольку интервалы сравнения для двух других групп не пересекаются с интервалами для группы 1, они выделяются красным цветом. Отсутствие пересечения указывает на то, что оба средства отличаются от среднего значения для группы 1. Выберите другие средства группы, чтобы подтвердить, что все средства группы значительно отличаются друг от друга.
Выполните несколько сравнительных тестов, чтобы увидеть, что выход попкорна различается между двумя типами поппера (строками).
c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions.

c = 1×6
1.0000 2.0000 -1.3828 -1.0000 -0.6172 0.0001
Небольшое значение p 0,0001 указывает на то, что выход попкорна различается между двумя типами поппера (воздух и масло). На рисунке показаны те же результаты. Непересекающиеся интервалы сравнения указывают, что групповые средства значительно отличаются друг от друга.
Загрузите образцы данных.
y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]';
g1 = [1 2 1 2 1 2 1 2];
g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'};
g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};y - вектор ответа и g1, g2, и g3 - переменные группирования (факторы). Каждый фактор имеет два уровня, и каждое наблюдение в y идентифицируется комбинацией уровней факторов. Например, наблюдение y(1) связан с уровнем 1 фактора g1, уровень 'hi' фактора g2, и уровень 'may' фактора g3. Аналогичным образом, наблюдение y(6) связан с уровнем 2 фактора g1, уровень 'hi' фактора g2, и уровень 'june' фактора g3.
Проверьте, одинакова ли реакция для всех уровней факторов. Также вычислите статистику, необходимую для нескольких тестов сравнения.
[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...
'varnames',{'g1','g2','g3'});
Значение p 0,2578 указывает, что средние ответы для уровней 'may' и 'june' фактора g3 существенно не отличаются. Значение p 0,0347 указывает, что среднее значение ответов для уровней 1 и 2 фактора g1 значительно отличаются друг от друга. Аналогично, значение p 0,0048 указывает, что средние ответы для уровней 'hi' и 'lo' фактора g2 значительно отличаются друг от друга.
Выполните несколько сравнительных тестов, чтобы выяснить, какие группы факторов g1 и g2 значительно отличаются друг от друга.
results = multcompare(stats,'Dimension',[1 2])
results = 6×6
1.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0272
1.0000 3.0000 4.4896 6.9500 9.4104 0.0170
1.0000 4.0000 6.1396 8.6000 11.0604 0.0136
2.0000 3.0000 8.8896 11.3500 13.8104 0.0101
2.0000 4.0000 10.5396 13.0000 15.4604 0.0087
3.0000 4.0000 -0.8104 1.6500 4.1104 0.0737
multcompare сравнивает комбинации групп (уровней) двух переменных группировки, g1 и g2. В results матрица, число 1 соответствует комбинации уровня 1 из g1 и уровень hi из g2, число 2 соответствует комбинации уровня 2 из g1 и уровень hi из g2. Аналогично, число 3 соответствует комбинации уровня 1 из g1 и уровень lo из g2, и число 4 соответствует комбинации уровня 2 из g1 и уровень lo из g2. Последний столбец матрицы содержит p-значения.
Например, первая строка матрицы показывает, что комбинация уровня 1 из g1 и уровень hi из g2 имеет те же средние значения отклика, что и комбинация уровня 2 из g1 и уровень hi из g2. Значение p, соответствующее этому тесту, равно 0,0280, что указывает на то, что средние ответы значительно отличаются. Этот результат также можно увидеть на рисунке. Синяя полоса показывает интервал сравнения для среднего отклика для комбинации уровней 1 из g1 и уровень hi из g2. Красные полосы являются интервалами сравнения для среднего ответа для других комбинаций групп. Ни одна из красных полос не перекрывается с синей полосой, что означает среднюю реакцию для комбинации уровня 1 из g1 и уровень hi из g2 значительно отличается от среднего ответа для других комбинаций групп.
Можно протестировать другие группы, щелкнув соответствующий интервал сравнения для группы. Панель, на которую вы нажимаете, становится синей. Полосы для групп, которые значительно отличаются, красные. Полосы для групп, которые существенно не отличаются, серые. Например, если щелкнуть интервал сравнения для комбинации уровней 1 из g1 и уровень lo из g2, интервал сравнения для комбинации уровней 2 из g1 и уровень lo из g2 перекрывается и поэтому является серым. И наоборот, другие интервалы сравнения являются красными, что указывает на значительную разницу.
stats - Данные испытанийТестовые данные, указанные как структура. Создать структуру можно с помощью одной из следующих функций:
multcompare не поддерживает несколько сравнений с использованием anovan вывод для модели, включающей случайные или вложенные эффекты. Расчеты для модели случайных эффектов дают предупреждение о том, что все эффекты считаются фиксированными. Вложенные модели не принимаются.
Типы данных: struct
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
'Alpha',0.01,'CType','bonferroni','Display','off' вычисляет критические значения Бонферрони, проводит тесты гипотез на уровне значимости 1% и пропускает интерактивный дисплей.'Alpha' - Уровень значимости0.05 (по умолчанию) | скалярное значение в диапазоне (0,1)Уровень значимости теста множественного сравнения, указанный как пара, разделенная запятыми, состоящая из 'Alpha' и скалярное значение в диапазоне (0,1). Значение, указанное для 'Alpha' определяет доверительные уровни 100 × (1 - α) интервалов, возвращаемых в матрице c и на рисунке.
Пример: 'Alpha',0.01
Типы данных: single | double
'CType' - Тип критического значения'tukey-kramer' (по умолчанию) | 'hsd' | 'lsd' | 'bonferroni' | 'dunn-sidak' | 'scheffe'Тип критического значения, используемого для множественного сравнения, указанного как пара, разделенная запятыми, состоящая из 'CType' и одно из следующих.
| Стоимость | Описание |
|---|---|
'tukey-kramer' или 'hsd' | |
'bonferroni' | |
'dunn-sidak' | |
'lsd' | |
'scheffe' |
Пример: 'CType','bonferroni'
'Display' - Переключатель дисплея'on' (по умолчанию) | 'off'Переключатель отображения, заданный как разделенная запятыми пара, состоящая из 'Display' и либо 'on' или 'off'. При указании 'on', то multcompare отображает график оценок и их интервалы сравнения. При указании 'off', то multcompare опускает график.
Пример: 'Display','off'
'Dimension' - Размер, по которому рассчитываются предельные значения1 (по умолчанию) | положительное целое значение | вектор положительных целых значенийВектор, задающий размер или размеры, по которым вычисляется предельное значение заполнения, указанное как положительное целое значение, или вектор таких значений. Используйте 'Dimension' пара имя-значение только при создании структуры ввода stats использование функции anovan.
Например, при указании 'Dimension' как 1, то multcompare сравнивает средства для каждого значения первой переменной группирования, скорректированные путем удаления эффектов других переменных группирования, как если бы конструкция была сбалансирована. При указании 'Dimension'как [1,3], то multcompare вычисляет предельное значение заполнения для каждой комбинации первой и третьей переменных группирования, устраняя эффекты второй переменной группирования. Если вы подходите к сингулярной модели, некоторые клеточные средства могут быть не оценены, и любые популяционные маргинальные средства, которые зависят от этих клеточных средств, будут иметь значение NaN.
Предельные значения популяции описаны Милликеном и Джонсоном (1992) и Сирлом, Спидом и Милликеном (1980). Идея, лежащая в основе маргинальных средств населения, состоит в том, чтобы устранить любой эффект несбалансированной конструкции путем фиксации значений факторов, указанных 'Dimension'и усреднение эффектов других факторов, как если бы каждая комбинация факторов происходила одинаковое количество раз. Определение предельных значений численности населения не зависит от количества наблюдений при каждой комбинации факторов. Для разработанных экспериментов, в которых количество наблюдений при каждой комбинации факторов не имеет значения, предельные средства популяции могут быть легче интерпретировать, чем простые средства, игнорирующие другие факторы. Для обследований и других исследований, в которых количество наблюдений в каждой комбинации имеет значение, предельные показатели численности населения могут быть более трудными для толкования.
Пример: 'Dimension',[1,3]
Типы данных: single | double
'Estimate' - Сопоставляемые оценки'column' (по умолчанию) | 'row' | 'slope' | 'intercept' | 'pmm'Сравниваемые оценки, указанные как пара, разделенная запятыми, состоящая из 'Estimate' и допустимое значение. Допустимые значения для 'Estimate' зависит от функции, используемой для создания структуры ввода stats, согласно следующей таблице.
| Источник | Ценности |
|---|---|
anova1 | Ничего. Эта пара имя-значение игнорируется, и |
anova2 | Также |
anovan | Ничего. Эта пара имя-значение игнорируется, и |
aoctool | Также |
friedman | Ничего. Эта пара имя-значение игнорируется, и |
kruskalwallis | Ничего. Эта пара имя-значение игнорируется, и |
Пример: 'Estimate','row'
c - Матрица множественных результатов сравненияМатрица множественных результатов сравнения, возвращаемая как матрица p-на-6 скалярных значений, где p - количество пар групп. Каждая строка матрицы содержит результат одного парного теста сравнения. Столбцы 1 и 2 содержат индексы двух сравниваемых выборок. Столбец 3 содержит нижний доверительный интервал, столбец 4 содержит оценку, а столбец 5 содержит верхний доверительный интервал. Столбец 6 содержит значение p для проверки гипотезы, что соответствующая средняя разница не равна 0.
Например, предположим, что одна строка содержит следующие записи.
2.0000 5.0000 1.9442 8.2206 14.4971 0.0432
Эти числа указывают на то, что среднее значение группы 2 минус среднее значение группы 5 оценивается в 8,2206, а 95% доверительный интервал для истинной разницы значений составляет [1.9442, 14.4971]. P-значение для соответствующей проверки гипотезы, что разность средних групп 2 и 5 значительно отличается от нуля, равно 0,0432.
В этом примере доверительный интервал не содержит 0, поэтому разница значима на уровне значимости 5%. Если доверительный интервал действительно содержит 0, разница не будет значительной. Значение p 0,0432 также указывает на то, что разница между средствами групп 2 и 5 значительно отличается от 0.
m - Матрица оценокМатрица оценок, возвращаемая как матрица скалярных значений. Первый столбец m содержит оценочные значения средств (или любой сравниваемой статистики) для каждой группы, а второй столбец содержит их стандартные ошибки.
h - Ручка к рисункуМаркер к рисунку, содержащему интерактивный график, возвращенный как маркер. Заголовок этого графа содержит инструкции по взаимодействию с графом, а метка оси X содержит информацию о том, какие средства значительно отличаются от выбранного среднего. Если этот график планируется использовать для представления, можно опустить заголовок и метку оси X. Их можно удалить с помощью интерактивных элементов окна графика или с помощью следующих команд.
title('') xlabel('')
gnames - Названия группИмена групп, возвращаемые в виде массива ячеек векторов символов. Каждая строка gnames содержит имя группы.
Анализ дисперсии сравнивает средства нескольких групп для проверки гипотезы, что они все равны, с общей альтернативой, что они не все равны. Иногда эта альтернатива может быть слишком общей. Вам может понадобиться информация о том, какие пары средств значительно отличаются, а какие нет.
При выполнении простого t-теста среднего значения одной группы относительно другой задается уровень значимости, определяющий значение отсечки t-статистики. Например, можно указать значение alpha = 0.05 чтобы гарантировать, что, когда нет реальной разницы, вы неправильно найдете существенную разницу не более 5% времени. Когда есть много групповых средств, также есть много пар для сравнения. Если вы применили обычный t-тест в этой ситуации, alpha значение будет применяться к каждому сравнению, поэтому вероятность неправильного нахождения существенной разницы будет увеличиваться с количеством сравнений. Несколько процедур сравнения предназначены для обеспечения верхней границы вероятности того, что любое сравнение будет неправильно найдено значимым.
[1] Хохберг, Я. и А. К. Тамхане. Несколько процедур сравнения. Хобокен, Нью-Джерси: John Wiley & Sons, 1987.
[2] Милликен, Г. А. и Д. Э. Джонсон. Анализ беспорядочных данных, том I: Разработанные эксперименты. Бока Ратон, Флорида: Чепмен энд Холл/КПР Пресс, 1992.
[3] Сирл, С. Р., Ф. М. Спид и Г. А. Милликен. «Предельное население означает в линейной модели: альтернатива наименьшим квадратам означает». Американский статистик. 1980, стр 216–221.
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.