Множественный сравнительный тест
возвращает матрицу c
= multcompare(stats
)c
результатов парного сравнения из многократного сравнительного теста с использованием информации, содержащейся в stats
структура. multcompare
также отображает интерактивный график оценок и интервалов сравнения. Каждое среднее значение группы представлено символом, а интервал представлен линией, отходящей от символа. Два групповых средства значительно различаются, если их интервалы являются несвязанными; они существенно не отличаются, если их интервалы перекрываются. Если вы используете мышь для выбора любой группы, то на графике будут подсвечены все другие группы, которые значительно отличаются, если таковые имеются.
возвращает матрицу парных результатов сравнения, c
= multcompare(stats
,Name,Value
)c
, с использованием дополнительных опций, заданных одним или несколькими Name,Value
аргументы в виде пар. Для примера можно задать интервал доверия или тип критического значения, которое будет использоваться при многократном сравнении.
Загрузите выборочные данные.
load carsmall
Выполните однофакторный дисперсионный анализ (ANOVA), чтобы увидеть, есть ли различие между пробегом автомобилей по происхождению.
[p,t,stats] = anova1(MPG,Origin,'off');
Выполните многократное сравнение средств группы.
[c,m,h,nms] = multcompare(stats);
multcompare
отображает оценки с интервалами сравнения вокруг них. Можно кликнуть графики каждой страны, чтобы сравнить ее среднее значение с показателями других стран.
Теперь отобразите средние оценки и стандартные ошибки с соответствующими именами групп.
[nms num2cell(m)]
ans=6×3 cell array
{'USA' } {[21.1328]} {[0.8814]}
{'Japan' } {[31.8000]} {[1.8206]}
{'Germany'} {[28.4444]} {[2.3504]}
{'France' } {[23.6667]} {[4.0711]}
{'Sweden' } {[22.5000]} {[4.9860]}
{'Italy' } {[ 28]} {[7.0513]}
Загрузите выборочные данные.
load popcorn
popcorn
popcorn = 6×3
5.5000 4.5000 3.5000
5.5000 4.5000 4.0000
6.0000 4.0000 3.0000
6.5000 5.0000 4.0000
7.0000 5.5000 5.0000
7.0000 5.0000 4.5000
Данные взяты из исследования брендов попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn
являются брендами (Gourmet, National и Generic). Строки типа popper - нефть и воздух. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером. Значениями являются выражение в чашках попкорна.
Выполните двухсторонний Дисперсионный Анализ. Также вычислите статистику, которую необходимо выполнить для выполнения нескольких сравнительных тестов основных эффектов.
[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
source: 'anova2'
sigmasq: 0.1389
colmeans: [6.2500 4.7500 4]
coln: 6
rowmeans: [4.5000 5.5000]
rown: 9
inter: 1
pval: 0.7462
df: 12
The stats
структура включает
Средняя квадратичная невязка (sigmasq
)
Оценки среднего выражения для каждой марки попкорна (colmeans
)
Количество наблюдений за каждой маркой попкорна (coln
)
Оценка среднего выражения для каждого типа поппера (rowmeans
)
Количество наблюдений для каждого типа popper (rown
)
Количество взаимодействий (inter
)
P-значение, которое показывает уровень значимости термина взаимодействия (pval
)
Степени свободы ошибки (df
).
Выполните многократный сравнительный тест, чтобы увидеть, отличается ли выражение попкорна между парами марок попкорна (столбцов).
c = multcompare(stats)
Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions.
c = 3×6
1.0000 2.0000 0.9260 1.5000 2.0740 0.0000
1.0000 3.0000 1.6760 2.2500 2.8240 0.0000
2.0000 3.0000 0.1760 0.7500 1.3240 0.0116
Первые два столбца c
показать группы, которые сравниваются. В четвертом столбце показано различие между предполагаемыми средними значениями группы. Третий и пятый столбцы показывают нижний и верхний пределы для 95% доверительных интервалов для истинного среднего различия. Шестой столбец содержит p-значение для критерия гипотезы, что соответствующее среднее различие равно нулю. Все значения p (0, 0 и 0,0116) очень малы, что указывает на то, что выражение попкорна отличается по всем трем маркам.
Рисунок показывает многократное сравнение средств. По умолчанию подсвечивается среднее значение группы 1, а интервал сравнения выделяется синим цветом. Поскольку интервалы сравнения для двух других групп не пересекаются с интервалами для среднего значения группы 1, они подсвечиваются красным цветом. Отсутствие пересечения указывает, что оба средства отличаются от среднего значения группы 1. Выберите другое средство группы, чтобы подтвердить, что все средства группы значительно отличаются друг от друга.
Выполните многократный сравнительный тест, чтобы увидеть, что выход попкорна отличается между двумя типами поппера (строки).
c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term. A test of main effects can be difficult to interpret when the model includes interactions.
c = 1×6
1.0000 2.0000 -1.3828 -1.0000 -0.6172 0.0001
Малое значение p 0,0001 указывает, что выражение попкорна отличается между двумя типами поппера (воздух и масло). Рисунки показывают те же результаты. Несвязанные интервалы сравнения показывают, что групповые средства значительно отличаются друг от друга.
Загрузите выборочные данные.
y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]'; g1 = [1 2 1 2 1 2 1 2]; g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};
y
- вектор отклика и g1
, g2
, и g3
являются сгруппированными переменными (факторами). Каждый фактор имеет два уровня и каждое наблюдение в y
определяется комбинацией уровней факторов. Для примера, y(1) наблюдений
связана с уровнем 1 фактора g1
, уровни 'hi'
фактора g2
, и уровни 'may'
фактора g3
. Точно так же y(6)
наблюдений связана с уровнем 2 фактора
g1
, уровни 'hi'
фактора g2
, и уровни 'june'
фактора g3
.
Проверьте, является ли реакция одинаковой для всех уровней факторов. Также вычислите статистику, необходимую для нескольких сравнительных тестов.
[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',... 'varnames',{'g1','g2','g3'});
Значение p 0,2578 указывает, что средние отклики для уровней 'may'
и 'june'
фактора g3
существенно не отличаются. Значение p 0,0347 указывает, что средние отклики для уровней 1
и 2
фактора g1
значительно отличаются. Точно так же значение p 0,0048 указывает, что средние отклики для уровней 'hi'
и 'lo'
фактора g2
значительно отличаются.
Выполните несколько сравнительных тестов, чтобы выяснить, какие группы факторов g1
и g2
значительно отличаются.
results = multcompare(stats,'Dimension',[1 2])
results = 6×6
1.0000 2.0000 -6.8604 -4.4000 -1.9396 0.0272
1.0000 3.0000 4.4896 6.9500 9.4104 0.0170
1.0000 4.0000 6.1396 8.6000 11.0604 0.0136
2.0000 3.0000 8.8896 11.3500 13.8104 0.0101
2.0000 4.0000 10.5396 13.0000 15.4604 0.0087
3.0000 4.0000 -0.8104 1.6500 4.1104 0.0737
multcompare
сравнивает комбинации групп (уровней) двух сгруппированных переменных, g1
и g2
. В results
матрица, число 1 соответствует комбинации уровней 1
от g1
и уровни hi
от g2
, число 2 соответствует комбинации уровней 2
от g1
и уровни hi
от g2
. Точно так же число 3 соответствует комбинации уровней 1
от g1
и уровни lo
от g2
, и число 4 соответствует комбинации уровней 2
от g1
и уровни lo
от g2
. Последний столбец матрицы содержит p-значения.
Для примера первая строка матрицы показывает, что комбинация уровней 1
от g1
и уровни hi
от g2
имеет те же средние значения отклика, что и комбинация 2 уровня
от g1
и уровни hi
от g2
. Значение p, соответствующее этому тесту, составляет 0,0280, что указывает на то, что средние отклики значительно отличаются. Этот результат можно также увидеть на рисунке. Синяя полоса показывает интервал сравнения для средней характеристики для комбинации уровней 1
от g1
и уровни hi
от g2
. Красные полосы являются интервалами сравнения для среднего отклика для других комбинаций групп. Ни одна из красных полос не перекрывается с синей полоской, что означает среднюю характеристику для комбинации 1
уровня от
g1
и уровни hi
от g2
значительно отличается от среднего отклика для других групповых комбинаций.
Можно протестировать другие группы, щелкнув на соответствующем интервале сравнения для группы. Панель, на которой вы нажимаете, становится синей. Столбцы для групп, которые значительно отличаются, являются красными. Столбцы для групп, которые существенно не отличаются, являются серыми. Для примера, если вы кликните по интервалу сравнения для комбинации уровней 1
от g1
и уровни lo
от g2
, интервал сравнения для комбинации уровней 2
от g1
и уровни lo
от g2
перекрывается, и поэтому является серым. И наоборот, другие интервалы сравнения являются красными, что указывает на значительное различие.
stats
- Тестовые данныеТестовые данные, заданные как структура. Вы можете создать структуру с помощью одной из следующих функций:
multcompare
не поддерживает несколько сравнений, используя anovan
выход для модели, которая включает случайные или вложенные эффекты. Вычисления для модели случайных эффектов дают предупреждение, что все эффекты рассматриваются как фиксированные. Вложенные модели не принимаются.
Типы данных: struct
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
'Alpha',0.01,'CType','bonferroni','Display','off'
вычисляет критические значения Бонферрони, проводит проверку гипотезы на уровне значимости 1% и опускает интерактивное отображение.'Alpha'
- Уровень значимости0.05
(по умолчанию) | скалярное значение в области значений (0,1)Уровень значимости теста многократного сравнения, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha'
и скалярное значение в области значений (0,1). Значение, заданное для 'Alpha'
определяет 100 × (1 - α) доверительные уровни интервалов, возвращаемых в матрицу c
и на рисунке.
Пример: 'Alpha',0.01
Типы данных: single
| double
'CType'
- Тип критического значения'tukey-kramer'
(по умолчанию) | 'hsd'
| 'lsd'
| 'bonferroni'
| 'dunn-sidak'
| 'scheffe'
Тип критического значения для многократного сравнения, заданный как разделенная разделенными запятой парами, состоящая из 'CType'
и одно из следующих.
Значение | Описание |
---|---|
'tukey-kramer' или 'hsd' | |
'bonferroni' | |
'dunn-sidak' | |
'lsd' | |
'scheffe' |
Пример: 'CType','bonferroni'
'Display'
- Отображение дисплея'on'
(по умолчанию) | 'off'
Отобразите переключатель, заданный как разделенная разделенными запятой парами, состоящая из 'Display'
и любой из них 'on'
или 'off'
. Если вы задаете 'on'
, затем multcompare
отображает график оценок и их интервалов сравнения. Если вы задаете 'off'
, затем multcompare
опускает график.
Пример: 'Display','off'
'Dimension'
- Размерность, по которой можно вычислить маргинальные средства1
(по умолчанию) | положительное целое число | вектор положительных целых значенийВектор, задающий размерность или размерности, по которым можно вычислить маргинальное значение населения, заданное в виде положительного целого числа, или вектор таких значений. Используйте 'Dimension'
Пара "имя-значение" только, если вы создаете вход структуру stats
использование функции anovan
.
Для примера, если вы задаете 'Dimension'
как 1
, затем multcompare
сравнивает средство для каждого значения первой сгруппированной переменной, скорректированное путем удаления эффектов других сгруппированных переменных так, как если бы проект был сбалансирован. Если вы задаете 'Dimension'
как [1,3]
, затем multcompare
вычисляет население предельные средства для каждой комбинации первых и третьих сгруппированных переменных, удаляя эффекты второй сгруппированной переменной. Если вы подбираете сингулярную модель, некоторые средства камеры могут быть не оценены, и любые маргинальные средства населения, которые зависят от этих средств камеры, будут иметь значение NaN
.
Населения маргинальные средства описаны Милликеном и Джонсоном (1992) и Searle, Speed и Milliken (1980). Идея предельных средств для населения состоит в том, чтобы удалить любой эффект несбалансированного проекта путем фиксации значений факторов, заданных 'Dimension'
и усреднение эффектов других факторов, как если бы каждая комбинация факторов происходила одинаковое количество раз. Определение маргинальных средств населения не зависит от количества наблюдений при каждой комбинации факторов. Для спроектированных экспериментов, где количество наблюдений в каждой комбинации факторов не имеет никакого значения, население маргинальные средства могут быть легче интерпретировать, чем простые способы получения игнорирующие другие факторы. Для обследований и других исследований, где количество наблюдений в каждой комбинации имеет смысл, маргинальные средства населения могут быть более трудными для интерпретации.
Пример: 'Dimension',[1,3]
Типы данных: single
| double
'Estimate'
- Оценки, которые необходимо сравнить'column'
(по умолчанию) | 'row'
| 'slope'
| 'intercept'
| 'pmm'
Сравниваемые оценки, заданные как разделенная разделенными запятой парами, состоящая из 'Estimate'
и допустимое значение. Допустимые значения для 'Estimate'
зависят от функции, используемой для генерации структуры входа stats
, согласно следующей таблице.
Источник | Значения |
---|---|
anova1 | Ничего. Эта пара "имя-значение" игнорируется, и |
anova2 | Либо |
anovan | Ничего. Эта пара "имя-значение" игнорируется, и |
aoctool | Либо |
friedman | Ничего. Эта пара "имя-значение" игнорируется, и |
kruskalwallis | Ничего. Эта пара "имя-значение" игнорируется, и |
Пример: 'Estimate','row'
c
- Матрица результатов нескольких сравненийМатрица результатов многократного сравнения, возвращенная как p-на-6 матрица скалярных значений, где p - количество пар групп. Каждая строка матрицы содержит результат одного парного теста сравнения. Столбцы 1 и 2 содержат индексы двух сравниваемых выборок. Столбец 3 содержит нижний доверительный интервал, столбец 4 содержит оценку, а столбец 5 содержит верхний доверительный интервал. Столбец 6 содержит p-значение для теста гипотезы, что соответствующее среднее различие не равно 0.
Например, предположим, что одна строка содержит следующие записи.
2.0000 5.0000 1.9442 8.2206 14.4971 0.0432
Эти числа указывают, что среднее значение группы 2 за вычетом среднего значения группы 5 оценивается в 8,2206, и 95% доверительный интервал для истинного различия средств составляет [1.9442, 14.4971]. Значение p для соответствующего теста гипотезы, что различие средств групп 2 и 5 значительно отличается от нуля, составляет 0,0432.
В этом примере доверительный интервал не содержит 0, поэтому различие значимо на уровне 5% значимости. Если доверие интервал содержал 0, различие не была бы значительной. Значение p 0,0432 также указывает, что различие средств групп 2 и 5 значительно отличается от 0.
m
- Матрица оценокМатрица оценок, возвращенная как матрица скалярных значений. Первый столбец m
содержит оценочные значения средств (или любых статистических данных, которые сравниваются) для каждой группы, а второй столбец содержит их стандартные ошибки.
h
- Указатель на рисунокУказатель на рисунок, содержащую интерактивный график, возвращаемый как указатель. Заголовок этого графика содержит инструкции для взаимодействия с графиком, а подпись по осям x-ось содержит информацию о том, какие средства значительно отличаются от выбранного среднего. Если вы планируете использовать этот график для представления, можно опустить заголовок и метку оси x. Можно удалить их с помощью интерактивных функций графика, или можно использовать следующие команды.
title('') xlabel('')
gnames
- Имена группИмена групп, возвращенные как массив ячеек из векторов символов. Каждая строка gnames
содержит имя группы.
Анализ отклонения сравнивает средства нескольких групп, чтобы проверить гипотезу, что все они равны, против общей альтернативы, что они не все равны. Иногда эта альтернатива может быть слишком общей. Вам может понадобиться информация о том, какие пары средств значительно отличаются, а какие нет. Несколько сравнительных тестов могут предоставить эту информацию.
Когда вы выполняете простой t -тест среднего значения одной группы против другой, вы задаете уровень значимости, который определяет значение среза t -статистического. Для примера можно задать значение alpha
= 0.05
чтобы страховать, что, когда нет реального различия, вы неправильно найдете существенное различие не более 5% времени. Когда существует много групповых средств, существует также много пар для сравнения. Если вы применили обыкновенный t-тест в этой ситуации, alpha
значение будет применяться к каждому сравнению, поэтому вероятность неправильного нахождения существенного различия увеличится с количеством сравнений. Множественные процедуры сравнения разработаны, чтобы обеспечить верхнюю границу вероятности того, что любое сравнение будет неправильно найдено значительным.
[1] Hochberg, Y., and A. C. Tamhane. Множественные процедуры сравнения. Hoboken, NJ: John Wiley & Sons, 1987.
[2] Милликен, Г. А. и Д. Э. Джонсон. Анализ данных Messy, том I: Разработанные эксперименты. Бока Ратон, FL: Chapman & Hall/CRC Press, 1992.
[3] Searle, S. R., F. M. Speed, and G. A. Milliken. «Граничное население означает в линейной модели: альтернатива малым квадратам означает». Американский статистик. 1980, стр 216–221.
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.