exponenta event banner

anova2

Двусторонний анализ отклонений

Описание

anova2 выполняет двусторонний дисперсионный анализ (ANOVA) со сбалансированными конструкциями. Для выполнения двусторонней ANOVA с несбалансированными конструкциями см. anovan.

пример

p = anova2(y,reps) возвращает значения p для сбалансированной двусторонней ANOVA для сравнения средних значений двух или более столбцов и двух или более строк наблюдений в y.

reps - количество повторений для каждой комбинации факторных групп, которое должно быть постоянным, что указывает на сбалансированную конструкцию. Для несбалансированных конструкций используйте anovan. anova2 функция проверяет основные эффекты для факторов столбцов и строк и их эффект взаимодействия. Чтобы проверить эффект взаимодействия, reps должно быть больше 1.

anova2 также отображает стандартную таблицу ANOVA.

пример

p = anova2(y,reps,displayopt) включает отображение таблицы ANOVA, когда displayopt является 'on' (по умолчанию) и подавляет отображение, когда displayopt является 'off'.

пример

[p,tbl] = anova2(___) возвращает таблицу ANOVA (включая метки столбцов и строк) в массиве ячеек tbl. Чтобы скопировать текстовую версию таблицы ANOVA в буфер обмена, выберите меню «Правка» > «Копировать текст».

пример

[p,tbl,stats] = anova2(___) возвращает stats структура, которую можно использовать для выполнения нескольких сравнительных тестов. Множественный тест сравнения позволяет определить, какие пары групповых средств значительно отличаются. Для выполнения этого теста используйте multcompare, предоставление stats структура в качестве входных данных.

Примеры

свернуть все

Загрузите образцы данных.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные взяты из исследования марок попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами, Gourmet, National и Generic соответственно. Строки - это типы поппера, масла и воздуха. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером, то есть количество репликаций равняется 3. Первые три ряда соответствуют масляной поппере, а последние три ряда соответствуют воздушной поппере. Значения ответа представляют собой выход в чашках попкорна.

Выполнить двустороннюю ANOVA. Сохранение таблицы ANOVA в массиве ячеек tbl для упрощения доступа к результатам.

[p,tbl] = anova2(popcorn,3);

Figure Two-way ANOVA contains objects of type uicontrol.

Колонка Prob>F показаны значения p для трех марок попкорна (0.0000), двух типов поппера (0.0001) и взаимодействия между маркой и типом поппера (0.7462). Эти значения указывают на то, что марка попкорна и тип попкорна влияют на выход попкорна, но нет никаких доказательств эффекта взаимодействия между ними.

Отображение массива ячеек, содержащего таблицу ANOVA.

tbl
tbl=6×6 cell array
  Columns 1 through 5

    {'Source'     }    {'SS'     }    {'df'}    {'MS'      }    {'F'       }
    {'Columns'    }    {[15.7500]}    {[ 2]}    {[  7.8750]}    {[ 56.7000]}
    {'Rows'       }    {[ 4.5000]}    {[ 1]}    {[  4.5000]}    {[ 32.4000]}
    {'Interaction'}    {[ 0.0833]}    {[ 2]}    {[  0.0417]}    {[  0.3000]}
    {'Error'      }    {[ 1.6667]}    {[12]}    {[  0.1389]}    {0x0 double}
    {'Total'      }    {[     22]}    {[17]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[7.6790e-07]}
    {[1.0037e-04]}
    {[    0.7462]}
    {0x0 double  }
    {0x0 double  }

Храните F-статистику для факторов и взаимодействия факторов в отдельных переменных.

Fbrands = tbl{2,5}
Fbrands = 56.7000
Fpoppertype = tbl{3,5}
Fpoppertype = 32.4000
Finteraction = tbl{4,5}
Finteraction = 0.3000

Загрузите образцы данных.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные взяты из исследования марок попкорна и типов поппера (Hogg 1987). Столбцы матрицы popcorn являются брендами (Gourmet, National и Generic). Строки представляют собой масло и воздух хлопкового типа. В исследовании исследователи трижды всплывали партию каждой марки с каждым поппером. Значения представляют собой выход в чашках попкорна.

Выполнить двустороннюю ANOVA. Также вычислите статистику, необходимую для выполнения множественного теста сравнения основных эффектов.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

stats структура включает в себя

  • Средняя квадратичная ошибка (sigmasq)

  • Оценки средней доходности для каждой марки попкорна (colmeans)

  • Количество наблюдений за каждой маркой попкорна (coln)

  • Оценка среднего выхода для каждого типа поппера (rowmeans)

  • Количество наблюдений для каждого типа поппера (rown)

  • Количество взаимодействий (inter)

  • P-значение, показывающее уровень значимости члена взаимодействия (pval)

  • Степени свободы ошибок (df).

Выполните несколько сравнительных тестов, чтобы выяснить, отличается ли выход попкорна между парами марок попкорна (колонки).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of column means contains an axes. The axes with title Click on the group you want to test contains 7 objects of type line.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c показать сравниваемые группы. В четвертом столбце показана разница между оцененными значениями группы. Третий и пятый столбцы показывают нижний и верхний пределы для 95% доверительных интервалов для истинной средней разницы. Шестой столбец содержит p-значение для проверки гипотезы, что соответствующая средняя разность равна нулю. Все значения p (0, 0 и 0,0116) очень малы, что указывает на то, что выход попкорна различается для всех трех марок.

На рисунке показано многократное сравнение средств. По умолчанию среднее значение группы 1 выделено, а интервал сравнения - синим. Поскольку интервалы сравнения для двух других групп не пересекаются с интервалами для группы 1, они выделяются красным цветом. Отсутствие пересечения указывает на то, что оба средства отличаются от среднего значения для группы 1. Выберите другие средства группы, чтобы подтвердить, что все средства группы значительно отличаются друг от друга.

Выполните несколько сравнительных тестов, чтобы увидеть, что выход попкорна различается между двумя типами поппера (строками).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

Figure Multiple comparison of row means contains an axes. The axes with title Click on the group you want to test contains 5 objects of type line.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Небольшое значение p 0,0001 указывает на то, что выход попкорна различается между двумя типами поппера (воздух и масло). На рисунке показаны те же результаты. Непересекающиеся интервалы сравнения указывают, что групповые средства значительно отличаются друг от друга.

Входные аргументы

свернуть все

Образец данных, указанный как матрица. Столбцы соответствуют группам одного фактора, а строки соответствуют группам другого фактора и репликациям. Репликация - это измерения или наблюдения для каждой комбинации групп (уровней) коэффициента строки и столбца. Например, в следующих данных коэффициент строки A имеет три уровня, коэффициент столбца B имеет два уровня, и есть две репликации (reps = 2). Подстрочные индексы обозначают строку, столбец и репликацию соответственно.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]} A=1} A=2} A=3

Типы данных: single | double

Число репликаций для каждой комбинации групп, указанное как целое число. Например, следующие данные имеют две репликации (reps = 2) для каждой групповой комбинации коэффициента A строки и коэффициента B столбца.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]} A=1} A=2} A=3

  • Когда reps является 1 (по умолчанию), anova2 возвращает два значения p в векторе p:

    • P-значение для нулевой гипотезы, что все выборки из фактора B (то есть все выборки столбцов в y) взяты из одного и того же населения.

    • P-значение для нулевой гипотезы, что все выборки из фактора A (то есть все выборки строк в y) взяты из одного и того же населения.

  • Когда reps больше, чем 1, anova2 также возвращает p-значение для нулевой гипотезы, что факторы A и B не имеют взаимодействия (то есть эффекты, обусловленные факторами A и B, являются аддитивными).

Пример: p = anova(y,3) указывает, что каждая комбинация групп (уровней) имеет три репликации.

Типы данных: single | double

Индикатор для отображения таблицы ANOVA в виде цифры, указанной как 'on' или 'off'.

Выходные аргументы

свернуть все

p-значение для F-теста, возвращаемое как скалярное значение. Небольшое значение p указывает на то, что результаты являются статистически значимыми. Общие уровни значимости составляют 0,05 или 0,01. Например:

  • Достаточно малое значение p для нулевой гипотезы для групповых средних коэффициента A строки предполагает, что, по меньшей мере, одно среднее значение выборки строки значительно отличается от других средств выборки строки; то есть существует основной эффект от фактора А

  • Достаточно малое p-значение для нулевой гипотезы для группового (уровня) среднего коэффициента столбца В предполагает, что, по меньшей мере, одно среднее значение столбца-выборки значительно отличается от другого значения столбца-выборки; то есть существует основной эффект, обусловленный фактором В.

  • Достаточно малое значение p для комбинаций групп (уровней) факторов А и В позволяет предположить, что существует взаимодействие между факторами А и В.

таблица ANOVA, возвращенная в виде массива ячеек. tbl имеет шесть столбцов.

Имя столбцаОпределение
sourceИсточник изменчивости.
SSСумма квадратов для каждого источника.
dfСтепени свободы, связанные с каждым источником.
MSСредние квадраты для каждого источника, которое является отношением SS/df.
FF-статистика, которая является отношением средних квадратов.
Prob>Fp-значение, которое является вероятностью того, что F-статистика может принять значение, большее, чем вычисленное значение test-statistic. anova2 извлекает эту вероятность из cdF-распределения.

Строки таблицы ANOVA показывают изменчивость данных, разделенных источником на три или четыре части, в зависимости от значения reps.

РядОпределение
ColumnsИзменчивость из-за различий между столбцами
RowsИзменчивость из-за различий между значениями строк
Interaction

Изменчивость из-за взаимодействия между строками и столбцами (если reps больше значения по умолчанию 1)

ErrorОстающаяся изменчивость не объясняется каким-либо систематическим источником

Типы данных: cell

Статистика для нескольких тестов сравнения, возвращенная в виде структуры. Использовать multcompare для выполнения нескольких сравнительных тестов, предоставление stats в качестве входного аргумента. stats имеет девять полей.

Область Определение
sourceИсточник stats продукция
sigmasqСреднеквадратичная ошибка
colmeansРасчетные значения значений колонки
colnКоличество наблюдений для каждой группы в столбцах
rowmeansОценочные значения значений строки
rownКоличество наблюдений для каждой группы в строках
interКоличество взаимодействий
pvalp-значение для члена взаимодействия
dfСтепени свободы ошибок (reps - 1) * r * c, где reps - число репликаций, а c и r - число групп в факторах соответственно.

Типы данных: struct

Ссылки

[1] Хогг, Р. В. и Дж. Ледольтер. Инженерная статистика. Нью-Йорк: Макмиллан, 1987.

Представлен до R2006a