anova2

Двухсторонний дисперсионный анализ

anova2 выполняет двухсторонний дисперсионный анализ (АНОВА) со сбалансированными планами. Чтобы выполнить двухстороннюю АНОВУ с несбалансированными проектами, смотрите anovan.

Синтаксис

p = anova2(y,reps)
p = anova2(y,reps,displayopt)
[p,tbl] = anova2(___)
[p,tbl,stats] = anova2(___)

Описание

пример

p = anova2(y,reps) возвращает p - значения для сбалансированной двухсторонней АНОВОЙ для сравнения средних значений двух или больше столбцов и двух или больше строк наблюдений в y.

reps является количеством, реплицирует для каждой комбинации факторных групп, которые должны быть постоянными, указав на сбалансированный план. Для несбалансированных проектов используйте anovan. Функция anova2 тестирует основные эффекты на столбец и факторы строки и их эффект взаимодействия. Чтобы протестировать эффект взаимодействия, reps должен быть больше, чем 1.

anova2 также отображает стандарт таблица АНОВОЙ.

пример

p = anova2(y,reps,displayopt) включает табличное отображение АНОВОЙ, когда displayopt является 'on' (значение по умолчанию) и подавляет отображение, когда displayopt является 'off'.

пример

[p,tbl] = anova2(___) возвращает таблицу АНОВОЙ (включая столбец и метки строки) в массиве ячеек tbl. Чтобы скопировать текстовую версию таблицы АНОВОЙ к буферу обмена, выберите меню Edit > Copy Text.

пример

[p,tbl,stats] = anova2(___) возвращает структуру stats, которую можно использовать, чтобы выполнить тест сравнения кратного. Тест сравнения кратного позволяет вам определить, какие пары средних значений группы существенно отличаются. Чтобы выполнить этот тест, используйте multcompare, обеспечивая структуру stats, как введено.

Примеры

свернуть все

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn являются брендами, Gourmet, National, и Типичный, соответственно. Строки являются типами кнопки, нефтью и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой, то есть, количество репликаций равняется 3. Первые три строки соответствуют нефтяной кнопке, и последние три строки соответствуют воздушной кнопке. Значения ответа являются урожаем в чашках вытолканного попкорна.

Выполните двухстороннюю АНОВУ. Сохраните таблицу АНОВОЙ в массиве ячеек tbl для быстрого доступа к результатам.

[p,tbl] = anova2(popcorn,3);

Столбец Prob>F показывает p-значения для трех брендов попкорна (0.0000), два типа кнопки (0.0001), и взаимодействие между тип (0.7462) кнопки и брендом. Эти значения указывают, что бренд попкорна и тип кнопки влияют на урожай попкорна, но нет никакого доказательства эффекта взаимодействия двух.

Отобразите массив ячеек, содержащий таблицу АНОВОЙ.

tbl
tbl = 6x6 cell array
  Columns 1 through 5

    {'Source'     }    {'SS'     }    {'df'}    {'MS'      }    {'F'       }
    {'Columns'    }    {[15.7500]}    {[ 2]}    {[  7.8750]}    {[ 56.7000]}
    {'Rows'       }    {[ 4.5000]}    {[ 1]}    {[  4.5000]}    {[ 32.4000]}
    {'Interaction'}    {[ 0.0833]}    {[ 2]}    {[  0.0417]}    {[  0.3000]}
    {'Error'      }    {[ 1.6667]}    {[12]}    {[  0.1389]}    {0x0 double}
    {'Total'      }    {[     22]}    {[17]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[7.6790e-07]}
    {[1.0037e-04]}
    {[    0.7462]}
    {0x0 double  }
    {0x0 double  }

Сохраните F-статистическую-величину для факторов и факторного взаимодействия в отдельных переменных.

Fbrands = tbl{2,5}
Fbrands = 56.7000
Fpoppertype = tbl{3,5}
Fpoppertype = 32.4000
Finteraction = tbl{4,5}
Finteraction = 0.3000

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn являются брендами (Gourmet, National, и Типичный). Строки являются нефтью типов кнопки и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой. Значения являются урожаем в чашках вытолканного попкорна.

Выполните двухстороннюю АНОВУ. Также вычислите статистику, что необходимо выполнить тест сравнения кратного на основных эффектах.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

Структура stats включает

  • Среднеквадратическая ошибка (sigmasq)

  • Оценки среднего урожая для каждого бренда попкорна (colmeans)

  • Количество наблюдений для каждого бренда попкорна (coln)

  • Оценка среднего урожая для каждого типа кнопки (rowmeans)

  • Количество наблюдений для каждого типа кнопки (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значения периода взаимодействия (pval)

  • Ошибочные степени свободы (df).

Выполните тест сравнения кратного, чтобы видеть, отличается ли урожай попкорна между парами брендов попкорна (столбцы).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c показывают группы, которые сравнены. Четвертый столбец показывает различие между предполагаемыми средними значениями группы. Третьи и пятые колонны показывают нижние и верхние пределы для 95% доверительных интервалов для истинного среднего расхождения. Шестой столбец содержит p-значение для теста гипотезы, который равно нулю соответствующее среднее расхождение. Все p-значения (0, 0, и 0.0116) являются очень маленькими, который указывает, что урожай попкорна отличается через все три бренда.

Данные показывают несколько сравнение средних значений. По умолчанию среднее значение группы 1 подсвечено, и интервал сравнения находится в синем. Поскольку интервалы сравнения для других двух групп не пересекаются с интервалами для среднего значения группы 1, они подсвечены в красном. Это отсутствие пересечения указывает, что оба средних значения отличаются, чем среднее значение группы 1. Выберите другие средние значения группы, чтобы подтвердить, что все средние значения группы существенно отличаются друг от друга.

Выполните тест сравнения кратного, чтобы видеть, что попкорн уступить отличается между двумя типами кнопки (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Маленькое p-значение 0,0001 указывает, что урожай попкорна отличается между двумя типами кнопки (воздух и нефть). Данные показывают те же результаты. Непересекающиеся интервалы сравнения указывают, что средние значения группы существенно отличаются друг от друга.

Входные параметры

свернуть все

Выборочные данные, заданные как матрица. Столбцы соответствуют группам одного фактора, и строки соответствуют группам другого фактора и репликаций. Репликации являются измерениями или наблюдениями для каждой комбинации групп (уровни) фактора строки и столбца. Например, в следующих данных фактор строки A имеет три уровня, фактор столбца, B имеет два уровня, и существует две репликации (reps = 2). Индексы указывают на строку, столбец и репликацию, соответственно.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

Типы данных: single | double

Количество репликаций для каждой комбинации групп, заданных как целое число. Например, следующие данные имеют две репликации (reps = 2) для каждой комбинации группы фактора строки A и фактор столбца B.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

  • Когда reps является 1 (значение по умолчанию), anova2 возвращает два p - значения в векторном p:

    • p - значение для нулевой гипотезы, что все выборки от факторного B (т.е. все выборки столбца в y) чертятся от той же генеральной совокупности.

    • p - значение для нулевой гипотезы, что все выборки от факторного A (т.е. все выборки строки в y) чертятся от той же генеральной совокупности.

  • Когда reps больше, чем 1, anova2 также возвращает p - значение для нулевой гипотезы, что факторы, A и B не имеют никакого взаимодействия (т.е. эффекты из-за факторов A и B являются дополнением).

Пример: p = anova(y,3) указывает, что каждая комбинация групп (уровни) имеет три репликации.

Типы данных: single | double

Индикатор, чтобы отобразить таблицу АНОВОЙ как фигуру, заданную как 'on' или 'off'.

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как скалярное значение. Маленький p - значение указывает, что результаты являются статистически значительными. Общие уровни значения 0.05 или 0.01. Например:

  • Достаточно маленький p - значение для нулевой гипотезы для средних значений группы фактора строки, A предполагает, что по крайней мере одно демонстрационное строкой среднее значение существенно отличается от других демонстрационных строкой средних значений; т.е. существует основной эффект, должный учитывать A

  • Достаточно маленький p - значение для нулевой гипотезы для группы (уровень) средние значения фактора столбца, B предполагает, что по крайней мере одно демонстрационное столбцом среднее значение существенно отличается от других демонстрационных столбцом средних значений; т.е. существует основной эффект, должный учитывать B.

  • Достаточно маленький p - значение для комбинаций групп (уровни) факторов, A и B предполагают, что существует взаимодействие между факторами A и B.

Таблица АНОВОЙ, возвращенная как массив ячеек. tbl имеет шесть столбцов.

ColumnName Определение
sourceИсточник изменчивости.
SSСумма квадратов из-за каждого источника.
dfСтепени свободы сопоставлены с каждым источником.
MSСредние квадратичные для каждого источника, который является отношением SS/df.
FF-, которая является отношением средних квадратичных.
Prob>Fp - значение, которое является вероятностью, что F - статистическая величина может принять значение, больше, чем вычисленное статистическое тестом значение. anova2 выводит эту вероятность от cdf F - распределение.

Строки таблицы show АНОВОЙ изменчивость в данных, разделенных на источник в три или четыре части, в зависимости от значения reps.

СтрокаОпределение
ColumnsИзменчивость из-за различий среди средних значений столбца
RowsИзменчивость из-за различий среди средних значений строки
Interaction

Изменчивость из-за взаимодействия между строками и столбцами (если reps больше, чем его значение по умолчанию 1),

ErrorОстающаяся изменчивость, не объясненная любым систематическим источником

Типы данных: cell

Статистика для нескольких тестов сравнений, возвращенных как структура. Используйте multcompare, чтобы выполнить несколько тестов сравнения, предоставляя stats как входной параметр. stats имеет девять полей.

Поле Определение
sourceИсточник stats вывод
sigmasqСреднеквадратическая ошибка
colmeansОриентировочные стоимости средних значений столбца
colnКоличество наблюдений для каждой группы в столбцах
rowmeansОриентировочные стоимости средних значений строки
rownКоличество наблюдений для каждой группы в строках
interКоличество взаимодействий
pvalp- в течение периода взаимодействия
dfОшибочные степени свободы (reps — 1) *r*c, где reps является количеством репликаций и c и r, являются количеством групп в факторах, соответственно.

Типы данных: struct

Ссылки

[1] Хогг, R. V., и Дж. Ледолтер. Техническая статистика. Нью-Йорк: Макмиллан, 1987.

Представлено до R2006a