anova2

Двухсторонний дисперсионный анализ

Описание

anova2 выполняет двухсторонний дисперсионный анализ (ANOVA) с сбалансированными проектами. Для выполнения двухстороннего Дисперсионный Анализ с несбалансированными проектами смотрите anovan.

пример

p = anova2(y,reps) возвращает p -значения для сбалансированного двухстороннего Дисперсионный Анализ для сравнения средств двух или более столбцов и двух или более строк наблюдений в y.

reps - количество повторений для каждой комбинации групп факторов, которое должно быть постоянным, что указывает на сбалансированный проект. Для несбалансированных проектов используйте anovan. The anova2 функция проверяет основные эффекты для факторов столбца и строки и их эффект взаимодействия. Чтобы протестировать эффект взаимодействия, reps должно быть больше 1.

anova2 также отображает стандартную таблицу ANOVA.

пример

p = anova2(y,reps,displayopt) включает отображение таблицы ANOVA при displayopt является 'on' (по умолчанию) и подавляет отображение при displayopt является 'off'.

пример

[p,tbl] = anova2(___) возвращает таблицу ANOVA (включая метки столбцов и строк) в массиве ячеек tbl. Чтобы скопировать текстовую версию таблицы ANOVA в буфер обмена, выберите Edit > Copy Text меню.

пример

[p,tbl,stats] = anova2(___) возвращает stats структура, которую можно использовать для выполнения нескольких сравнительных тестов. Многократный сравнительный тест позволяет вам определить, какие пары групповых средств значительно отличаются. Чтобы выполнить этот тест, используйте multcompare, обеспечивая stats структура как вход.

Примеры

свернуть все

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные взяты из исследования брендов попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами, Gourmet, National и Generic, соответственно. К строкам относятся типы поппера, нефть и воздух. В исследовании исследователи трижды всплывали по партии каждой марки с каждым поппером, то есть количество репликаций составляет 3. Первые три строки соответствуют масляному попперу, а последние три строки соответствуют воздушному попперу. Значения отклика являются выражением в чашках попкорна.

Выполните двухсторонний Дисперсионный Анализ. Сохраните Дисперсионный Анализ таблицу в массиве ячеек tbl для быстрого доступа к результатам.

[p,tbl] = anova2(popcorn,3);

Figure Two-way ANOVA contains objects of type uicontrol.

Столбец Prob>F показывает значения p для трех марок попкорна (0,0000), двух типов поппера (0,0001) и взаимодействие между типом бренда и поппера (0,7462). Эти значения указывают на то, что марка попкорна и тип поппера влияют на выражение попкорна, но нет никаких доказательств эффекта взаимодействия этих двух.

Отображение массива ячеек, содержащего таблицу ANOVA.

tbl
tbl=6×6 cell array
  Columns 1 through 5

    {'Source'     }    {'SS'     }    {'df'}    {'MS'      }    {'F'       }
    {'Columns'    }    {[15.7500]}    {[ 2]}    {[  7.8750]}    {[ 56.7000]}
    {'Rows'       }    {[ 4.5000]}    {[ 1]}    {[  4.5000]}    {[ 32.4000]}
    {'Interaction'}    {[ 0.0833]}    {[ 2]}    {[  0.0417]}    {[  0.3000]}
    {'Error'      }    {[ 1.6667]}    {[12]}    {[  0.1389]}    {0x0 double}
    {'Total'      }    {[     22]}    {[17]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[7.6790e-07]}
    {[1.0037e-04]}
    {[    0.7462]}
    {0x0 double  }
    {0x0 double  }

Сохраните F-статистику для факторов и факторного взаимодействия в отдельных переменных.

Fbrands = tbl{2,5}
Fbrands = 56.7000
Fpoppertype = tbl{3,5}
Fpoppertype = 32.4000
Finteraction = tbl{4,5}
Finteraction = 0.3000

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные взяты из исследования брендов попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами (Gourmet, National и Generic). Строки типа popper - нефть и воздух. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером. Значениями являются выражение в чашках попкорна.

Выполните двухсторонний Дисперсионный Анализ. Также вычислите статистику, которую необходимо выполнить для выполнения нескольких сравнительных тестов основных эффектов.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

The stats структура включает

  • Средняя квадратичная невязка (sigmasq)

  • Оценки среднего выражения для каждой марки попкорна (colmeans)

  • Количество наблюдений за каждой маркой попкорна (coln)

  • Оценка среднего выражения для каждого типа поппера (rowmeans)

  • Количество наблюдений для каждого типа popper (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значимости термина взаимодействия (pval)

  • Степени свободы ошибки (df).

Выполните многократный сравнительный тест, чтобы увидеть, отличается ли выражение попкорна между парами марок попкорна (столбцов).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of column means contains an axes. The axes with title Click on the group you want to test contains 7 objects of type line.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c показать группы, которые сравниваются. В четвертом столбце показано различие между предполагаемыми средними значениями группы. Третий и пятый столбцы показывают нижний и верхний пределы для 95% доверительных интервалов для истинного среднего различия. Шестой столбец содержит p-значение для критерия гипотезы, что соответствующее среднее различие равно нулю. Все значения p (0, 0 и 0,0116) очень малы, что указывает на то, что выражение попкорна отличается по всем трем маркам.

Рисунок показывает многократное сравнение средств. По умолчанию подсвечивается среднее значение группы 1, а интервал сравнения выделяется синим цветом. Поскольку интервалы сравнения для двух других групп не пересекаются с интервалами для среднего значения группы 1, они подсвечиваются красным цветом. Отсутствие пересечения указывает, что оба средства отличаются от среднего значения группы 1. Выберите другое средство группы, чтобы подтвердить, что все средства группы значительно отличаются друг от друга.

Выполните многократный сравнительный тест, чтобы увидеть, что выход попкорна отличается между двумя типами поппера (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of row means contains an axes. The axes with title Click on the group you want to test contains 5 objects of type line.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Малое значение p 0,0001 указывает, что выражение попкорна отличается между двумя типами поппера (воздух и масло). Рисунки показывают те же результаты. Несвязанные интервалы сравнения показывают, что групповые средства значительно отличаются друг от друга.

Входные параметры

свернуть все

Выборочные данные, заданная как матрица. Столбцы соответствуют группам одного фактора, а строки соответствуют группам другого фактора и репликаций. Репликации являются измерениями или наблюдениями для каждой комбинации групп (уровней) фактора строки и столбца. Например, в следующих данных коэффициент строки A имеет три уровня, коэффициент столбца B имеет два уровня, и существует две репликации (reps = 2). Индексы указывают строку, столбец и репликацию соответственно.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

Типы данных: single | double

Количество репликаций для каждой комбинации групп, заданное в виде целого числа. Для примера следующие данные имеют две репликации (reps = 2) для каждой комбинации коэффициентов строк A и B столбцов.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

  • Когда reps является 1 (по умолчанию), anova2 возвращает два p -значения в векторном p:

    • Значение p для нулевой гипотезы о том, что все выборки из фактора B (т.е. все выборки столбцов в y) взяты из одного и того же населения.

    • Значение p для нулевой гипотезы, что все выборки из фактора A (т.е. все выборки строк в y) взяты из одного и того же населения.

  • Когда reps больше 1, anova2 также возвращает p -value для нулевой гипотезы о том, что факторы A и B не имеют никакого взаимодействия (т.е. эффекты из-за факторов A и B являются аддитивными).

Пример: p = anova(y,3) указывает, что каждая комбинация групп (уровней) имеет три репликации.

Типы данных: single | double

Индикатор для отображения таблицы ANOVA в виде рисунка, заданный как 'on' или 'off'.

Выходные аргументы

свернуть все

p -value для F -test, возвращенный как скалярное значение. Небольшое p -значение указывает, что результаты статистически значимы. Общие уровни значимости 0,05 или 0,01. Для примера:

  • Достаточно маленькое значение p для нулевой гипотезы для группового средства фактора A строк предполагает, что, по меньшей мере, одно среднее значение выборки строк значительно отличается от другого средства выборки строк; т.е. существует основной эффект из-за факторных A

  • Достаточно маленькое значение p для нулевой гипотезы для групповых (уровневых) средств столбцового фактора B предполагает, что, по меньшей мере, одно среднее значение для столбцовой выборки значительно отличается от другого средства для столбцовой выборки; т.е. существует основной эффект из-за факторных B.

  • Достаточно маленькое p-значение для комбинаций групп (уровней) факторов A и B предполагает, что существует взаимодействие между факторами A и B.

Дисперсионный Анализ, возвращенная как массив ячеек. tbl имеет шесть столбцов.

Имя столбцаОпределение
sourceИсточник изменчивости.
SSСумма квадратов по каждому источнику.
dfСтепени свободы, связанные с каждым источником.
MSСредние квадраты для каждого источника, что является отношением SS/df.
FF -статистический, который является отношением средних квадратов.
Prob>Fp -value, которая является вероятностью того, что F-statistic может взять значение, больше вычисленного тестово-статистического значения. anova2 выводит эту вероятность из cdf F -распределения.

Строки таблицы ANOVA показывают изменчивость данных, разделенных источником на три или четыре части, в зависимости от значения reps.

РядОпределение
ColumnsИзменчивость из-за различий между средними столбцами
RowsИзменчивость из-за различий между строками означает
Interaction

Изменчивость из-за взаимодействия между строками и столбцами (если reps больше, чем его значение по умолчанию 1)

ErrorОстающаяся изменчивость, не объясненная каким-либо систематическим источником

Типы данных: cell

Статистика для нескольких тестов сравнения, возвращенная как структура. Использовать multcompare для выполнения нескольких сравнительных тестов, поставляя stats как входной параметр. stats имеет девять полей.

Область Определение
sourceИсточник stats выход
sigmasqСредняя квадратичная невязка
colmeansРасчетные значения столбца означает
colnКоличество наблюдений для каждой группы в столбцах
rowmeansРасчетные значения строки означают
rownКоличество наблюдений для каждой группы в строках
interКоличество взаимодействий
pvalp -значение для термина взаимодействия
dfСтепени свободы ошибок (reps - 1) * r * c где reps - количество репликаций, а c и r - количество групп в факторах, соответственно.

Типы данных: struct

Ссылки

[1] Хогг, Р. В. и Дж. Ледолтер. Инженерная статистика. Нью-Йорк: Макмиллан, 1987.

Представлено до R2006a