exponenta event banner

АНОВА N-WAY

Введение в N-Way ANOVA

Можно использовать функцию anovan для выполнения операции N-way ANOVA. Используйте N-way ANOVA, чтобы определить, различаются ли средства в наборе данных относительно групп (уровней) множества факторов. По умолчанию anovan обрабатывает все переменные группировки как фиксированные эффекты. Пример ANOVA со случайными эффектами см. в разделе ANOVA со случайными эффектами. Для получения информации о повторяющихся измерениях см. раздел fitrm и ranova.

N-way ANOVA - обобщение двусторонней ANOVA. Для трех факторов, например, модель может быть записана как

yijkr = λ + αi + βj + βk + (αβ) ij + (αγ) ik + (βγ) jk + (αβγ) ijk + βijkr,

где

  • yijkr является наблюдением переменной ответа. i представляет группу i фактора A, i = 1, 2,..., I, j представляет группу j фактора B, j = 1, 2,..., J, k представляет группу k фактора C, и r представляет номер репликации, r = 1, 2, ..., R. Для константы R имеются суммарные наблюдения N = I * J * K * R, но количество наблюдений не обязательно должно быть одинаковым для каждой комбинации групп факторов.

  • λ - общее среднее значение.

  • αi - отклонения групп фактора А от общего среднего λ за счет фактора А. Значения αi суммы к 0.

    ∑i=1Iαi=0.

  • βj - отклонения групп в коэффициенте B от общего среднего λ из-за фактора B. Значения βj суммируют до 0.

    ∑j=1Jβj=0.

  • γ k - отклонения групп в коэффициенте С от общего среднего λ за счет фактора С. Значения γ k суммы к 0.

    ∑k=1Kγk=0.

  • (αβ) ij - член взаимодействия между факторами A и B. (αβ) ij sum до 0 по любому индексу.

    ∑i=1I (αβ) ij=∑j=1J (αβ) ij = 0.

  • (αγ) ik - член взаимодействия между факторами А и С. Значения (αγ) ik sum до 0 по любому индексу.

    ∑i=1I (αγ) ik=∑k=1K (αγ) ik = 0.

  • (βγ) jk - член взаимодействия между факторами B и C. Значения (βγ) jk sum до 0 по любому индексу.

    ∑j=1J (βγ) jk=∑k=1K (βγ) jk = 0.

  • (αβγ) ijk - член трехстороннего взаимодействия между факторами A, B и C. Значения (αβγ) ijk sum до 0 над любым индексом.

    ∑i=1I (αβγ) ijk=∑j=1J (αβγ) ijk=∑k=1K (αβγ) ijk = 0.

  • αijkr - это случайные нарушения. Предполагается, что они независимы, обычно распределены и имеют постоянную дисперсию.

Трехсторонняя ANOVA проверяет гипотезы о влиянии факторов A, B, C и их взаимодействиях на переменную ответа y. Гипотезы о равенстве средних ответов для групп фактора А таковы

H0:α1=α2⋯=αIH1: по крайней мере один αi  отличается, i =  1,  2,... , I.

Гипотезы о равенстве среднего ответа для групп фактора B таковы

H0:β1=β2=⋯=βJH1: по крайней мере , один βj  отличается,  j = 1 , 2 ,..., J.

Гипотезы о равенстве среднего ответа для групп фактора C таковы

H0:γ1=γ2=⋯=γKH1: по крайней мере , один γ k  различен, k =  1,  2,... , К.

Гипотезы о взаимодействии факторов таковы

H0: (αβ) ij =  0H1: по меньшей  мере один (αβ) ij≠0

H0: (αγ) ik =  0H1: по меньшей  мере один (αγ) ik≠0H0: (βγ)  jk = 0H1: по меньшей мере один (βγ) jk≠0H0: ( αβγ) ijk = 0H1: по меньшей мере один (αβγ) ijk≠0

В этом обозначении параметры с двумя подстрочными индексами, такими как (αβ) ij, представляют эффект взаимодействия двух факторов. Параметр (αβγ) ijk представляет собой трехстороннее взаимодействие. Модель ANOVA может иметь полный набор параметров или любое подмножество, но обычно она не включает сложные условия взаимодействия, если она также не включает все более простые термины для этих факторов. Например, обычно не включает трехстороннее взаимодействие без включения всех двусторонних взаимодействий.

Подготовка данных для N-Way ANOVA

В отличие от этого, anova1 и anova2, anovan не ожидает данных в табличной форме. Вместо этого он ожидает вектор измерений отклика и отдельный вектор (или текстовый массив), содержащий значения, соответствующие каждому фактору. Этот формат входных данных более удобен, чем матрицы, когда существует более двух факторов или когда число измерений на комбинацию факторов не является постоянным.

y = [y1, y2, y3, y4, y5, , yN]  g1 = {'C', 'B', 'B', , 'D'} g2 = [12 131 ⋯,2] g3 = {'привет', 'середина', 'низко', 'середина', 'привет', , 'низко'}

Выполнить N-Way ANOVA

В этом примере показано, как выполнять N-way ANOVA для данных автомобилей с пробегом и другой информацией о 406 автомобилях, сделанных в период с 1970 по 1982 год.

Загрузите образцы данных.

load carbig

В этом примере основное внимание уделяется четырем переменным. MPG - количество миль на галлон для каждого из 406 автомобилей (хотя некоторые из них имеют отсутствующие значения, закодированные как NaN). Другими тремя переменными являются факторы: cyl4 (четырехцилиндровый автомобиль или нет), org (автомобиль возник в Европе, Японии или США), и when (автомобиль был построен в начале периода, в середине периода или в конце периода).

Подгоните полную модель, требуя до трехсторонних взаимодействий и сумм квадратов типа 3.

varnames = {'Origin';'4Cyl';'MfgDate'};
anovan(MPG,{org cyl4 when},3,3,varnames)

Figure N-Way ANOVA contains objects of type uicontrol.

ans = 7×1

    0.0000
       NaN
    0.0000
    0.7032
    0.0001
    0.2072
    0.6990

Обратите внимание, что многие члены помечены символом # как не имеющие полного ранга, и один из них имеет нулевые степени свободы и не имеет p-значения. Это может произойти, если отсутствуют комбинации факторов и модель имеет термины более высокого порядка. В этом случае приведенная ниже перекрестная таблица показывает, что в Европе нет автомобилей, изготовленных в начале периода с другими, чем четыре, цилиндрами, как указано цифрой 0 в tbl(2,1,1).

[tbl,chi2,p,factorvals] = crosstab(org,when,cyl4)
tbl = 
tbl(:,:,1) =

    82    75    25
     0     4     3
     3     3     4


tbl(:,:,2) =

    12    22    38
    23    26    17
    12    25    32

chi2 = 207.7689
p = 8.0973e-38
factorvals=3×3 cell array
    {'USA'   }    {'Early'}    {'Other'   }
    {'Europe'}    {'Mid'  }    {'Four'    }
    {'Japan' }    {'Late' }    {0x0 double}

Следовательно, невозможно оценить эффекты трехстороннего взаимодействия, и включение члена трехстороннего взаимодействия в модель делает аппроксимацию единственной.

Используя даже ограниченную информацию, доступную в таблице ANOVA, можно увидеть, что трехстороннее взаимодействие имеет p-значение 0,699, поэтому оно не является значительным.

Изучите только двусторонние взаимодействия.

[p,tbl2,stats,terms] = anovan(MPG,{org cyl4 when},2,3,varnames);

Figure N-Way ANOVA contains objects of type uicontrol.

terms
terms = 6×3

     1     0     0
     0     1     0
     0     0     1
     1     1     0
     1     0     1
     0     1     1

Сейчас все сроки оценочные. P-значения для члена взаимодействия 4 (Origin*4Cyl) и член взаимодействия 6 (4Cyl*MfgDate) намного больше, чем типичное пороговое значение 0,05, что указывает на то, что эти термины не значимы. Можно опустить эти термины и объединить их эффекты с термином ошибки. Продукция terms переменная возвращает матрицу кодов, каждый из которых является битовым шаблоном, представляющим член.

Опустить термины из модели, удалив их записи из terms.

terms([4 6],:) = []
terms = 4×3

     1     0     0
     0     1     0
     0     0     1
     1     0     1

Управляемый anovan опять же, на этот раз предоставление результирующего вектора в качестве аргумента модели. Возвращайте также статистические данные, необходимые для множественных сравнений факторов.

[~,~,stats] = anovan(MPG,{org cyl4 when},terms,3,varnames)

Figure N-Way ANOVA contains objects of type uicontrol.

stats = struct with fields:
         source: 'anovan'
          resid: [1x406 double]
         coeffs: [18x1 double]
            Rtr: [10x10 double]
       rowbasis: [10x18 double]
            dfe: 388
            mse: 14.1056
    nullproject: [18x10 double]
          terms: [4x3 double]
        nlevels: [3x1 double]
     continuous: [0 0 0]
         vmeans: [3x1 double]
       termcols: [5x1 double]
     coeffnames: {18x1 cell}
           vars: [18x3 double]
       varnames: {3x1 cell}
       grpnames: {3x1 cell}
        vnested: []
            ems: []
          denom: []
        dfdenom: []
        msdenom: []
         varest: []
          varci: []
       txtdenom: []
         txtems: []
        rtnames: []

Теперь у вас есть более экономная модель, указывающая, что пробег этих автомобилей, похоже, связан со всеми тремя факторами, и что эффект от даты изготовления зависит от того, где был сделан автомобиль.

Выполните несколько сравнений для координат и цилиндров.

results = multcompare(stats,'Dimension',[1,2])

Figure Multiple comparison of population marginal means contains an axes. The axes with title Click on the group you want to test contains 13 objects of type line.

results = 15×6

    1.0000    2.0000   -5.4891   -3.8412   -2.1932    0.0000
    1.0000    3.0000   -4.4146   -2.7251   -1.0356    0.0001
    1.0000    4.0000   -9.9992   -8.5828   -7.1664         0
    1.0000    5.0000  -14.0237  -12.4240  -10.8242         0
    1.0000    6.0000  -12.8980  -11.3080   -9.7180         0
    2.0000    3.0000   -0.7171    1.1160    2.9492    0.5085
    2.0000    4.0000   -7.3655   -4.7417   -2.1179    0.0000
    2.0000    5.0000   -9.9992   -8.5828   -7.1664         0
    2.0000    6.0000   -9.7464   -7.4668   -5.1872    0.0000
    3.0000    4.0000   -8.5396   -5.8577   -3.1757    0.0000
      ⋮

См. также

| | |

Связанные примеры

Подробнее