anova2

Двухсторонний дисперсионный анализ

Описание

anova2 выполняет двухсторонний дисперсионный анализ (Дисперсионный Анализ) со сбалансированными планами. Чтобы выполнить двухсторонний Дисперсионный Анализ с несбалансированными проектами, смотрите anovan.

пример

p = anova2(y,reps) возвращает p - значения для сбалансированного двухстороннего Дисперсионного Анализа для сравнения средних значений двух или больше столбцов и двух или больше строк наблюдений в y.

reps количество, реплицирует для каждой комбинации факторных групп, которые должны быть постоянными, указав на сбалансированный план. Для несбалансированных проектов используйте anovan. anova2 функционируйте тестирует основные эффекты на столбец и факторы строки и их эффект взаимодействия. Протестировать эффект взаимодействия, reps должен быть больше 1.

anova2 также отображает стандартную таблицу ANOVA.

пример

p = anova2(y,reps,displayopt) включает отображение таблицы ANOVA когда displayopt 'on' (значение по умолчанию) и подавляет отображение когда displayopt 'off'.

пример

[p,tbl] = anova2(___) возвращает таблицу ANOVA (включая столбец и метки строки) в массиве ячеек tbl. Чтобы скопировать текстовую версию таблицы ANOVA к буферу обмена, выберите меню Edit > Copy Text.

пример

[p,tbl,stats] = anova2(___) возвращает stats структура, которую можно использовать, чтобы выполнить тест сравнения кратного. Тест сравнения кратного позволяет вам определить, какие пары средних значений группы существенно отличаются. Чтобы выполнить этот тест, используйте multcompare, обеспечение stats структура, как введено.

Примеры

свернуть все

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn бренды, Gourmet, National, и Типовой, соответственно. Строки являются типами кнопки, нефтью и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой, то есть, количество репликаций равняется 3. Первые три строки соответствуют нефтяной кнопке, и последние три строки соответствуют воздушной кнопке. Значения ответа являются урожаем в чашках вытолканного попкорна.

Выполните двухсторонний Дисперсионный Анализ. Сохраните таблицу ANOVA в массиве ячеек tbl для быстрого доступа к результатам.

[p,tbl] = anova2(popcorn,3);

Столбец Prob>F показывает p-значения для трех брендов попкорна (0.0000), два типа кнопки (0.0001), и взаимодействие между тип (0.7462) кнопки и брендом. Эти значения указывают, что бренд попкорна и тип кнопки влияют на урожай попкорна, но нет никакого доказательства эффекта взаимодействия двух.

Отобразите массив ячеек, содержащий таблицу ANOVA.

tbl
tbl=6×6 cell array
  Columns 1 through 5

    {'Source'     }    {'SS'     }    {'df'}    {'MS'      }    {'F'       }
    {'Columns'    }    {[15.7500]}    {[ 2]}    {[  7.8750]}    {[ 56.7000]}
    {'Rows'       }    {[ 4.5000]}    {[ 1]}    {[  4.5000]}    {[ 32.4000]}
    {'Interaction'}    {[ 0.0833]}    {[ 2]}    {[  0.0417]}    {[  0.3000]}
    {'Error'      }    {[ 1.6667]}    {[12]}    {[  0.1389]}    {0x0 double}
    {'Total'      }    {[     22]}    {[17]}    {0x0 double}    {0x0 double}

  Column 6

    {'Prob>F'    }
    {[7.6790e-07]}
    {[1.0037e-04]}
    {[    0.7462]}
    {0x0 double  }
    {0x0 double  }

Сохраните F-статистическую-величину для факторов и факторного взаимодействия в отдельных переменных.

Fbrands = tbl{2,5}
Fbrands = 56.7000
Fpoppertype = tbl{3,5}
Fpoppertype = 32.4000
Finteraction = tbl{4,5}
Finteraction = 0.3000

Загрузите выборочные данные.

load popcorn
popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Данные от исследования брендов попкорна и типов кнопки (Хогг 1987). Столбцы матричного popcorn бренды (Gourmet, National, и Типовой). Строки являются нефтью типов кнопки и воздухом. В исследовании исследователи вытолкали пакет каждого бренда три раза с каждой кнопкой. Значения являются урожаем в чашках вытолканного попкорна.

Выполните двухсторонний Дисперсионный Анализ. Также вычислите статистику, что необходимо выполнить тест сравнения кратного на основных эффектах.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

stats структура включает

  • Среднеквадратическая ошибка (sigmasq)

  • Оценки среднего урожая для каждого бренда попкорна (colmeans)

  • Количество наблюдений для каждого бренда попкорна (coln)

  • Оценка среднего урожая для каждого типа кнопки (rowmeans)

  • Количество наблюдений для каждого типа кнопки (rown)

  • Количество взаимодействий (inter)

  • P-значение, которое показывает уровень значения периода взаимодействия (pval)

  • Ошибочные степени свободы (df).

Выполните тест сравнения кратного, чтобы видеть, отличается ли урожай попкорна между парами брендов попкорна (столбцы).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Первые два столбца c покажите группы, которые сравнены. Четвертый столбец показывает различие между предполагаемыми средними значениями группы. Третьи и пятые колонны показывают нижние и верхние пределы для 95% доверительных интервалов для истинного среднего расхождения. Шестой столбец содержит p-значение для теста гипотезы, который равно нулю соответствующее среднее расхождение. Все p-значения (0, 0, и 0.0116) очень малы, который указывает, что урожай попкорна отличается через все три бренда.

Рисунок показывает несколько сравнение средних значений. По умолчанию среднее значение группы 1 подсвечено, и интервал сравнения находится в синем. Поскольку интервалы сравнения для других двух групп не пересекаются с интервалами для среднего значения группы 1, они подсвечены в красном. Это отсутствие пересечения указывает, что оба средних значения отличаются, чем среднее значение группы 1. Выберите другие средние значения группы, чтобы подтвердить, что все средние значения группы существенно отличаются друг от друга.

Выполните тест сравнения кратного, чтобы видеть, что попкорн уступить отличается между двумя типами кнопки (строки).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be 
difficult to interpret when the model includes interactions.

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

Маленькое p-значение 0,0001 указывает, что урожай попкорна отличается между двумя типами кнопки (воздух и нефть). Рисунок показывает те же результаты. Непересекающиеся интервалы сравнения указывают, что средние значения группы существенно отличаются друг от друга.

Входные параметры

свернуть все

Выборочные данные в виде матрицы. Столбцы соответствуют группам одного фактора, и строки соответствуют группам другого фактора и репликаций. Репликации являются измерениями или наблюдениями для каждой комбинации групп (уровни) фактора строки и столбца. Например, в следующих данных фактор строки A имеет три уровня, фактор столбца, B имеет два уровня, и существует две репликации (reps = 2). Индексы указывают на строку, столбец и репликацию, соответственно.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

Типы данных: single | double

Количество репликаций для каждой комбинации групп в виде целого числа. Например, следующие данные имеют две репликации (reps = 2) для каждой комбинации группы фактора строки A и фактор столбца B.

B=1B=2[y111y121y112y122y211y221y212y222y311y321y312y322]}A=1}A=2}A=3

  • Когда reps 1 (значение по умолчанию), anova2 возвращает два p - значения в векторном p:

    • p - значение для нулевой гипотезы, что все выборки от факторного B (т.е. все выборки столбца в y) чертятся от того же населения.

    • p - значение для нулевой гипотезы, что все выборки от факторного A (т.е. все выборки строки в y) чертятся от того же населения.

  • Когда reps больше 1, anova2 также возвращает p - значение для нулевой гипотезы, что факторы, A и B не имеют никакого взаимодействия (т.е. эффекты из-за факторов A и B являются дополнением).

Пример: p = anova(y,3) указывает, что каждая комбинация групп (уровни) имеет три репликации.

Типы данных: single | double

Индикатор, чтобы отобразить таблицу ANOVA как фигуру в виде 'on' или 'off'.

Выходные аргументы

свернуть все

p - значение для F - тест, возвращенный как скалярное значение. Маленький p - значение указывает, что результаты являются статистически значительными. Общие уровни значения 0.05 или 0.01. Например:

  • Достаточно маленький p - значение для нулевой гипотезы для средних значений группы фактора строки, который A предлагает в наименьшем количестве одного демонстрационного строкой среднего значения, существенно отличается от других демонстрационных строкой средних значений; т.е. существует основной эффект, должный учитывать A

  • Достаточно маленький p - значение для нулевой гипотезы для группы (уровень) средние значения фактора столбца, который B предлагает в наименьшем количестве одного демонстрационного столбцом среднего значения, существенно отличается от других демонстрационных столбцом средних значений; т.е. существует основной эффект, должный учитывать B.

  • Достаточно маленький p - значение для комбинаций групп (уровни) факторов, A и B предполагают, что существует взаимодействие между факторами A и B.

Таблица ANOVA, возвращенная как массив ячеек. tbl имеет шесть столбцов.

ColumnName Определение
sourceИсточник изменчивости.
SSСумма квадратов из-за каждого источника.
dfСтепени свободы сопоставлены с каждым источником.
MSСредние квадратичные для каждого источника, который является отношением SS/df.
FF-, которая является отношением средних квадратичных.
Prob>Fp - значение, которое является вероятностью, что F - статистическая величина может принять значение, больше, чем вычисленное статистическое тестом значение. anova2 выводит эту вероятность из cdf F - распределение.

Строки таблицы ANOVA показывают изменчивость в данных, разделенных на источник в три или четыре части, в зависимости от значения reps.

СтрокаОпределение
ColumnsИзменчивость из-за различий среди средних значений столбца
RowsИзменчивость из-за различий среди средних значений строки
Interaction

Изменчивость из-за взаимодействия между строками и столбцами (если reps больше его значения по умолчанию 1)

ErrorОстающаяся изменчивость, не объясненная любым систематическим источником

Типы данных: cell

Статистика для нескольких тестов сравнений, возвращенных как структура. Используйте multcompare выполнять несколько тестов сравнения, предоставляя stats как входной параметр. stats имеет девять полей.

Поле Определение
sourceИсточник stats вывод
sigmasqСреднеквадратическая ошибка
colmeansОриентировочные стоимости средних значений столбца
colnКоличество наблюдений для каждой группы в столбцах
rowmeansОриентировочные стоимости средних значений строки
rownКоличество наблюдений для каждой группы в строках
interКоличество взаимодействий
pvalp- в течение периода взаимодействия
dfОшибочные степени свободы (reps — 1) *r*c, где reps является количеством репликаций и c и r, являются количеством групп в факторах, соответственно.

Типы данных: struct

Ссылки

[1] Хогг, R. V., и Дж. Ледолтер. Техническая статистика. Нью-Йорк: Макмиллан, 1987.

Представлено до R2006a