N-Way ANOVA

Введение в N-Way ANOVA

Вы можете использовать функцию anovan для выполнения N-стороннего Дисперсионный Анализ. Используйте N-сторонний Дисперсионный Анализ, чтобы определить, отличаются ли средства в наборе данных от групп (уровней) нескольких факторов. По умолчанию, anovan рассматривает все сгруппированные переменные как фиксированные эффекты. Пример Дисперсионный Анализ со случайными эффектами см. в Дисперсионный Анализ с случайными эффектами. Для повторных измерений смотрите fitrm и ranova.

N-сторонний Дисперсионный Анализ является обобщением двухстороннего Дисперсионный Анализ. Для трех факторов, например, модель может быть записана как

yijkr=μ+αi+βj+γk+(αβ)ij+(αγ)ik+(βγ)jk+(αβγ)ijk+εijkr,

где

  • yijkr является наблюдением переменной отклика. i представляет группу <reservedrangesplaceholder19> фактора A, i = 1, 2..., I, j представляет группу <reservedrangesplaceholder14> фактора B, j = 1, 2..., J, k представляет группу <reservedrangesplaceholder9> фактора C, и r представляет число повторения, r = 1, 2..., R. Для постоянного R есть в общей сложности N = I * J * K * R наблюдения, но количество наблюдений не должно быть тем же для каждой комбинации групп факторов.

  • μ - общее среднее.

  • αi - отклонения групп факторов, A от общего среднего μ из-за фактора A. Значения αi суммы равны 0.

    i=1Iαi=0.

  • βj являются отклонения групп в факторе B от общего среднего μ из-за фактора B. Значения βj суммы равны 0.

    j=1Jβj=0.

  • γk являются отклонения групп в факторе C от общего среднего μ из-за фактора C. Значения γk суммы равны 0.

    k=1Kγk=0.

  • (αβ) ij - термин взаимодействия между факторами A и B. (αβ) ij сумму до 0 по любому индексу.

    i=1I(αβ)ij=j=1J(αβ)ij=0.

  • (αγ) ik - термин взаимодействия между факторами A и C. Значения (αγ) ik сумму до 0 по любому индексу.

    i=1I(αγ)ik=k=1K(αγ)ik=0.

  • (βγ) jk - термин взаимодействия между факторами B и C. Значения (βγ) jk сумму до 0 по любому индексу.

    j=1J(βγ)jk=k=1K(βγ)jk=0.

  • (αβγ) ijk является трехсторонним термином взаимодействия между факторами A, B и C. Значения (αβγ) ijk сумму до 0 по любому индексу.

    i=1I(αβγ)ijk=j=1J(αβγ)ijk=k=1K(αβγ)ijk=0.

  • εijkr случайные нарушения порядка. Они приняты независимыми, обычно распределенными и имеют постоянное отклонение.

Трехсторонний Дисперсионный Анализ проверяет гипотезы о эффектах факторов A, B, C и их взаимодействий на переменные y отклика. Гипотезы о равенстве средних ответов для групп факторных A следующие

H0:α1=α2=αIH1: по крайней мере один αi отличается , i=1, 2, ..., I.

Гипотезы о равенстве среднего отклика для групп факторных B следующие

H0:β1=β2==βJH1: по крайней мере один βj отличается ,  j=1, 2, ..., J.

Гипотезы о равенстве среднего отклика для групп факторных C следующие

H0:γ1=γ2==γKH1: по крайней мере один γk отличается , k=1, 2, ..., K.

Гипотезы о взаимодействии факторов

H0:(αβ)ij=0H1:по крайней мере один (αβ)ij0

H0:(αγ)ik=0H1:по крайней мере один (αγ)ik0H0:(βγ)jk=0H1:по крайней мере один (βγ)jk0H0:(αβγ)ijk=0H1:по крайней мере один (αβγ)ijk0

В этом параметрах обозначения с двумя нижними индексами, такими как (αβ) ij, представляют эффект взаимодействия двух факторов. Параметр (αβγ) ijk представляет трехстороннее взаимодействие. Модель ANOVA может иметь полный набор параметров или любое подмножество, но обычно она не включает сложные условия взаимодействия, если она также не включает все более простые условия для этих факторов. Для примера обычно не включают трехстороннее взаимодействие, не включая также все двухсторонние взаимодействия.

Подготовка данных для N-Way ANOVA

В отличие от этого, anova1 и anova2, anovan не ожидает данных в табличной форме. Вместо этого он ожидает вектор измерений отклика и отдельный вектор (или текстовый массив), содержащий значения, соответствующие каждому фактору. Этот формат входных данных более удобен, чем матрицы, когда существует более двух факторов или когда количество измерений на комбинацию факторов не является постоянным.

y=[y1,y2,y3,y4,y5,,yN]g1={'A','A','C','B','B',,'D'}g2=[12131,2]g3={'привет','середина','низко','середина','привет',,'низко'}

Выполните Nway ANOVA

Этот пример показывает, как выполнить N-сторонний Дисперсионный Анализ по данным автомобиля с пробегом и другой информацией о 406 автомобилях, сделанных в период с 1970 по 1982 год.

Загрузите выборочные данные.

load carbig

Пример фокусируется на четырех переменных. MPG количество миль на галлон для каждого из 406 автомобилей (хотя некоторые имеют отсутствующие значения, закодированные как NaN). Три другие переменные являются факторами: cyl4 (четырехцилиндровый автомобиль или нет), org (автомобиль возник в Европе, Японии или США), и when (автомобиль был построен в начале периода, в середине периода или в конце периода).

Подгонка полной модели, запрос до трехсторонних взаимодействий и сумм квадратов типа 3.

varnames = {'Origin';'4Cyl';'MfgDate'};
anovan(MPG,{org cyl4 when},3,3,varnames)

Figure N-Way ANOVA contains objects of type uicontrol.

ans = 7×1

    0.0000
       NaN
    0.0000
    0.7032
    0.0001
    0.2072
    0.6990

Обратите внимание, что многие условия отмечены символом # как не имеющие полного ранга, и один из них имеет нулевые степени свободы и пропускает p-значение. Это может произойти, когда отсутствуют комбинации факторов, и модель имеет условия более высокого порядка. В этом случае приведенная ниже перекрестная табуляция показывает, что в Европе нет автомобилей, изготовленных в ранней части периода с другими, чем четырьмя цилиндрами, что обозначено символом 0 в tbl(2,1,1).

[tbl,chi2,p,factorvals] = crosstab(org,when,cyl4)
tbl = 
tbl(:,:,1) =

    82    75    25
     0     4     3
     3     3     4


tbl(:,:,2) =

    12    22    38
    23    26    17
    12    25    32

chi2 = 207.7689
p = 8.0973e-38
factorvals=3×3 cell array
    {'USA'   }    {'Early'}    {'Other'   }
    {'Europe'}    {'Mid'  }    {'Four'    }
    {'Japan' }    {'Late' }    {0x0 double}

Следовательно, невозможно оценить эффекты трехстороннего взаимодействия, и включая члена в модели трехстороннего взаимодействия делает подгонку сингулярной.

Используя даже ограниченную информацию, доступную в таблице ANOVA, можно увидеть, что трехстороннее взаимодействие имеет значение p 0,699, поэтому оно не является значимым.

Исследуйте только двухсторонние взаимодействия.

[p,tbl2,stats,terms] = anovan(MPG,{org cyl4 when},2,3,varnames);

Figure N-Way ANOVA contains objects of type uicontrol.

terms
terms = 6×3

     1     0     0
     0     1     0
     0     0     1
     1     1     0
     1     0     1
     0     1     1

Теперь все условия можно оценить. Значения p для члена 4 взаимодействия (Origin*4Cyl) и условие взаимодействия 6 (4Cyl*MfgDate) намного больше, чем типовое значение среза 0,05, что указывает на то, что эти условия не значительны. Можно принять решение опустить эти условия и объединить их эффекты в термин ошибки. Область выхода terms переменная возвращает матрицу кодов, каждый из которых является битовым шаблоном, представляющим термин.

Опустить условия из модели путем удаления их записей из terms.

terms([4 6],:) = []
terms = 4×3

     1     0     0
     0     1     0
     0     0     1
     1     0     1

Выполняйте anovan снова на этот раз, поставляя полученный вектор в качестве аргумента модели. Также возвращает статистику, необходимую для нескольких сравнений факторов.

[~,~,stats] = anovan(MPG,{org cyl4 when},terms,3,varnames)

Figure N-Way ANOVA contains objects of type uicontrol.

stats = struct with fields:
         source: 'anovan'
          resid: [1x406 double]
         coeffs: [18x1 double]
            Rtr: [10x10 double]
       rowbasis: [10x18 double]
            dfe: 388
            mse: 14.1056
    nullproject: [18x10 double]
          terms: [4x3 double]
        nlevels: [3x1 double]
     continuous: [0 0 0]
         vmeans: [3x1 double]
       termcols: [5x1 double]
     coeffnames: {18x1 cell}
           vars: [18x3 double]
       varnames: {3x1 cell}
       grpnames: {3x1 cell}
        vnested: []
            ems: []
          denom: []
        dfdenom: []
        msdenom: []
         varest: []
          varci: []
       txtdenom: []
         txtems: []
        rtnames: []

Теперь у вас есть более скупая модель, указывающая, что пробег этих автомобилей, кажется, связан со всеми тремя факторами, и что эффект даты производства зависит от того, где был сделан автомобиль.

Выполните несколько сравнений для источник и Cylinder.

results = multcompare(stats,'Dimension',[1,2])

Figure Multiple comparison of population marginal means contains an axes. The axes with title Click on the group you want to test contains 13 objects of type line.

results = 15×6

    1.0000    2.0000   -5.4891   -3.8412   -2.1932    0.0000
    1.0000    3.0000   -4.4146   -2.7251   -1.0356    0.0001
    1.0000    4.0000   -9.9992   -8.5828   -7.1664         0
    1.0000    5.0000  -14.0237  -12.4240  -10.8242         0
    1.0000    6.0000  -12.8980  -11.3080   -9.7180         0
    2.0000    3.0000   -0.7171    1.1160    2.9492    0.5085
    2.0000    4.0000   -7.3655   -4.7417   -2.1179    0.0000
    2.0000    5.0000   -9.9992   -8.5828   -7.1664         0
    2.0000    6.0000   -9.7464   -7.4668   -5.1872    0.0000
    3.0000    4.0000   -8.5396   -5.8577   -3.1757    0.0000
      ⋮

См. также

| | |

Похожие примеры

Подробнее о