anova

Класс: GeneralizedLinearMixedModel

Анализ отклонения для обобщенной модели линейных смешанных эффектов

Описание

пример

stats = anova(glme) возвращает таблицу, stats, который содержит результаты F-тестов, чтобы определить, все ли коэффициенты, представляющие каждый термин с фиксированными эффектами в обобщенной модели линейных смешанных эффектов glme равны 0.

stats = anova(glme,Name,Value) возвращает таблицу, stats, с использованием дополнительных опций, заданных одним или несколькими Name,Value аргументы в виде пар. Например, можно задать метод, используемый для вычисления приблизительных степеней свободы знаменателя для F -tests.

Входные параметры

расширить все

Обобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Метод вычисления приблизительных степеней свободы знаменателя для использования в F -test, заданный как разделенная разделенными запятой парами, состоящая из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Степени свободы приняты постоянными и равными n - p, где n - количество наблюдений и p - количество фиксированных эффектов.
'none'Все степени свободы установлены в бесконечность.

Степени свободы знаменателя для F - статистическая величина соответствуют столбцу DF2 в структуру output stats.

Пример: 'DFMethod','none'

Выходные аргументы

расширить все

Результаты F-тестов для терминов с фиксированными эффектами, возвращенные как таблица с одной строкой для каждого термина с фиксированными эффектами в glme и следующие столбцы.

Имя столбцаОписание
TermИмя термина фиксированных эффектов
FStatF -статистический для термина
DF1Числитель степеней свободы для F -statistic
DF2Знаменательные степени свободы для F -статистического
pValuep -значение термина

Каждый термин с фиксированными эффектами является непрерывной переменной, сгруппированной переменной или взаимодействием между двумя или более непрерывными или сгруппированными переменными. Для каждого срока действия фиксированных эффектов, anova выполняет F -test (маргинальный тест), чтобы определить, все ли коэффициенты, представляющие термин с фиксированными эффектами, равны 0.

Чтобы выполнить тесты для гипотезы типа III, при подборе обобщенной линейной модели смешанных эффектов fitglme, вы должны использовать 'effects' контрасты для 'DummyVarCoding' аргумент пары "имя-значение".

Примеры

расширить все

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите термин случайных эффектов для точки пересечения, сгруппированного по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectij Пуассон(μij)

Это соответствует обобщенной модели линейных смешанных эффектов

logμij=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)',...
'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects')
glme = 
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

Выполните F-test, чтобы определить, равны ли все коэффициенты с фиксированными эффектами 0.

stats = anova(glme)
stats = 
    ANOVA marginal tests: DFMethod = 'residual'

    Term                   FStat       DF1    DF2    pValue    
    {'(Intercept)'}           84.41    1      94     9.8194e-15
    {'newprocess' }          4.2881    1      94       0.041122
    {'time_dev'   }        0.013016    1      94        0.90941
    {'temp_dev'   }        0.086696    1      94        0.76907
    {'supplier'   }         0.59212    2      94         0.5552

p-значения для точки пересечения, newprocess, time_dev, и temp_dev те же, что и в таблице коэффициентов glme отображение. Маленькое p-значения для точки пересечения и newprocess указывают, что это значительные предикторы на уровне 5% значимости. Большое p-значения для time_dev и temp_dev указывают, что это не значимые предикторы на этом уровне.

p-значение 0,5552 для supplier измеряет совокупную значимость для обоих коэффициентов, представляющих категориальную переменную supplier. Сюда входят фиктивные переменные supplier_C и supplier_B как показано в таблице коэффициентов glme отображение. Большое p-значение указывает, что supplier не является значимым предиктором на уровне 5% значимости.

Совет

  • Для каждого срока действия фиксированных эффектов, anova выполняет F -test (маргинальный тест), чтобы определить, все ли коэффициенты, представляющие термин с фиксированными эффектами, равны 0.

    При подборе обобщенной линейной модели смешанных эффектов (GLME) использование fitglme и один из максимальных методов подгонки правдоподобия ('Laplace' или 'ApproximateLaplace'):

    • Если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'conditional', затем F -тесты обусловлены предполагаемыми ковариационными параметрами.

    • Если вы задаете 'CovarianceMethod' Пара "имя-значение" как 'JointHessian'тогда F-тесты учитывают неопределенность в оценке ковариационных параметров.

    При подборе модели GLME используя fitglme и один из методов подгонки псевдоправдоподобия ('MPL' или 'REMPL'), anova использует модель подгонянных линейных смешанных эффектов из окончательной итерации псевдоправдоподобия для вывода о фиксированных эффектах.