exponenta event banner

выдержать сравнение

Класс: модель GeneralizedLinearDepartedModel

Сравнение обобщенных линейных моделей смешанных эффектов

Описание

пример

results = compare(glme,altglme) возвращает результаты теста отношения правдоподобия, который сравнивает обобщенные линейные модели смешанных эффектов glme и altglme. Чтобы провести допустимый тест отношения правдоподобия, обе модели должны использовать один и тот же вектор отклика в подгонке, и glme должен быть вложен в altglme. Всегда вводите сначала модель меньшего размера, а затем модель большего размера.

compare проверяет следующие нулевые и альтернативные гипотезы:

  • H0: Наблюдаемый вектор отклика генерируется glme.

  • H1: Наблюдаемый вектор отклика генерируется моделью altglme.

results = compare(glme,altglme,Name,Value) возвращает результаты теста отношения правдоподобия с использованием дополнительных опций, указанных одним или несколькими Name,Value аргументы пары. Например, можно проверить, является ли первая входная модель glme, вложен во вторую входную модель, altglme.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Можно создать GeneralizedLinearMixedModel объект путем подгонки обобщенной линейной модели смешанных эффектов к данным выборки с использованием fitglme. Чтобы провести допустимый тест отношения правдоподобия для двух моделей, которые имеют распределения отклика, отличные от нормального, необходимо подогнать обе модели с помощью 'ApproximateLaplace' или 'Laplace' способ подгонки. Модели с распределениями ответов, отличными от обычных, которые устанавливаются с использованием 'MPL' или 'REMPL' невозможно сравнить с помощью теста отношения правдоподобия.

Альтернативная обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. altglme должно соответствовать тому же вектору отклика, что и glme, но с различными спецификациями модели. glme должен быть вложен в altglme, такой, что вы можете получить glme от altglme путем установки некоторых параметров модели altglme фиксированным значениям, таким как 0.

Можно создать GeneralizedLinearMixedModel объект путем подгонки обобщенной линейной модели смешанных эффектов к данным выборки с использованием fitglme. Чтобы провести допустимый тест отношения правдоподобия для двух моделей, которые имеют распределения отклика, отличные от нормального, необходимо подогнать обе модели с помощью 'ApproximateLaplace' или 'Laplace' способ подгонки. Модели с распределениями ответов, отличными от обычных, которые устанавливаются с использованием 'MPL' или 'REMPL' невозможно сравнить с помощью теста отношения правдоподобия.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Индикатор для проверки вложенности между двумя моделями, указанный как разделенная запятыми пара, состоящая из 'CheckNesting' и либо true или false. Если 'CheckNesting' является true, то compare проверяет, является ли модель меньшего размера glme вложен в большую модель altglme. Если требования к вложению не удовлетворены, то compare возвращает ошибку. Если 'CheckNesting' является false, то compare не выполняет эту проверку.

Пример: 'CheckNesting',true

Выходные аргументы

развернуть все

Результаты теста отношения правдоподобия, возвращенные в виде таблицы с двумя строками. Первая строка предназначена для glme, и вторая строка для altglme. Столбцы results содержат следующее.

Имя столбцаОписание
ModelИмя модели
DFСтепени свободы
AICИнформационный критерий Akaike для модели
BICБайесовский информационный критерий для модели
LogLikМаксимальная вероятность регистрации для модели
LRStatСтатистика теста отношения правдоподобия для сравнения altglme и glme
deltaDFDF для altglme минус DF для glme
pValuep-значение для теста отношения правдоподобия

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка модели только с фиксированными эффектами с помощью newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Укажите распределение ответа как Пуассон, функцию связи как log и метод аппроксимации как Лаплас. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

FEglme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Подгоните вторую модель, которая использует те же предикторы с фиксированными эффектами, распределение отклика, функцию связи и метод подгонки. На этот раз включите перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Сравните две модели, используя теоретический тест отношения правдоподобия. Определить 'CheckNesting' как true, так compare возвращает предупреждение, если требования к вложению не удовлетворены.

results = compare(FEglme,glme,'CheckNesting',true)
results = 
    Theoretical Likelihood Ratio Test

    Model     DF    AIC       BIC       LogLik     LRStat    deltaDF
    FEglme    6     431.02    446.65    -209.51                     
    glme      7     416.35    434.58    -201.17    16.672    1      


    pValue    
              
    4.4435e-05

С тех пор compare не вернул ошибку, требования по вложению удовлетворены. Небольшое значение p указывает на то, что compare отвергает нулевую гипотезу о том, что наблюдаемый вектор ответа генерируется моделью FEglme, и вместо этого принимает альтернативную модель glme. Меньшее AIC и BIC значения для glme также поддержать вывод о том, что glme обеспечивает более подходящую модель для ответа.

Подробнее

развернуть все