exponenta event banner

anova

Класс: модель GeneralizedLinearDepartedModel

Анализ дисперсии для обобщенной линейной модели смешанных эффектов

Описание

пример

stats = anova(glme) возвращает таблицу, stats, который содержит результаты F-тестов, чтобы определить, все ли коэффициенты, представляющие каждый член с фиксированными эффектами в обобщенной линейной модели с смешанными эффектами glme равны 0.

stats = anova(glme,Name,Value) возвращает таблицу, stats, используя дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары. Например, можно указать метод, используемый для вычисления приближенных степеней свободы знаменателя для F-тестов.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Метод вычисления приближенных степеней свободы знаменателя для использования в F-тесте, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

СтоимостьОписание
'residual'Степени свободы предполагаются постоянными и равными n - p, где n - число наблюдений и p - число фиксированных эффектов.
'none'Все степени свободы установлены на бесконечность.

Степени свободы знаменателя для F-статистики соответствуют столбцу DF2 в структуре вывода stats.

Пример: 'DFMethod','none'

Выходные аргументы

развернуть все

Результаты F-тестов для терминов с фиксированными эффектами, возвращенные в виде таблицы с одной строкой для каждого термина с фиксированными эффектами в glme и следующие столбцы.

Имя столбцаОписание
TermНаименование термина с фиксированными эффектами
FStatF-Статистика за термин
DF1Числительные степени свободы для F-статистики
DF2Степени свободы знаменателя для F-статистики
pValuep-значение для термина

Каждый член с фиксированными эффектами является непрерывной переменной, переменной группирования или взаимодействием между двумя или более непрерывными переменными или переменными группирования. Для каждого срока с фиксированными эффектами, anova выполняет F-тест (предельный тест), чтобы определить, равны ли все коэффициенты, представляющие член с фиксированными эффектами, 0.

Выполнение тестов для гипотезы типа III при подгонке обобщенной линейной модели смешанных эффектов fitglme, вы должны использовать 'effects' контрасты для 'DummyVarCoding' аргумент пары имя-значение.

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectij∼ Пуассон (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

logpciij = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)',...
'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects')
glme = 
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

Выполните F-тест, чтобы определить, равны ли все коэффициенты с фиксированными эффектами 0.

stats = anova(glme)
stats = 
    ANOVA marginal tests: DFMethod = 'residual'

    Term                   FStat       DF1    DF2    pValue    
    {'(Intercept)'}           84.41    1      94     9.8194e-15
    {'newprocess' }          4.2881    1      94       0.041122
    {'time_dev'   }        0.013016    1      94        0.90941
    {'temp_dev'   }        0.086696    1      94        0.76907
    {'supplier'   }         0.59212    2      94         0.5552

Значения p для перехвата, newprocess, time_dev, и temp_dev те же, что и в таблице коэффициентов glme дисплей. Небольшие значения p для перехвата и newprocess указывают, что это значимые предикторы на уровне значимости 5%. Большие значения p для time_dev и temp_dev указывают, что они не являются значимыми предикторами на этом уровне.

Значение p 0,5552 для supplier измеряет комбинированную значимость для обоих коэффициентов, представляющих категориальную переменную supplier. Сюда входят фиктивные переменные. supplier_C и supplier_B как показано в таблице коэффициентов glme дисплей. Большое значение p указывает, что supplier не является значимым предиктором на уровне значимости 5%.

Совет

  • Для каждого срока с фиксированными эффектами, anova выполняет F-тест (предельный тест), чтобы определить, равны ли все коэффициенты, представляющие член с фиксированными эффектами, 0.

    При подгонке модели с обобщенными линейными смешанными эффектами (GLME) с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'):

    • При указании 'CovarianceMethod' аргумент пары имя-значение как 'conditional', то F-тесты зависят от оцененных параметров ковариации.

    • При указании 'CovarianceMethod' пара имя-значение как 'JointHessian', то F-тесты учитывают неопределенность в оценке параметров ковариации.

    При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), anova использует аппроксимированную линейную модель смешанных эффектов из заключительной псевдопонятной итерации для вывода о фиксированных эффектах.