выдержать сравнение

Класс: модель GeneralizedLinearDepartedModel

Сравнение обобщенных линейных моделей смешанных эффектов

Синтаксис

результаты = сравнение (glme, altglme)

результаты = сравнение (glme, altglme, Name, Value)

Описание

results = compare(glme,altglme) возвращает результаты теста отношения правдоподобия, который сравнивает обобщенные линейные модели смешанных эффектов glme и altglme. Чтобы провести допустимый тест отношения правдоподобия, обе модели должны использовать один и тот же вектор отклика в подгонке, и glme должен быть вложен в altglme. Всегда вводите сначала модель меньшего размера, а затем модель большего размера.

compare проверяет следующие нулевые и альтернативные гипотезы:

H0: Наблюдаемый вектор отклика генерируется glme.
H1: Наблюдаемый вектор отклика генерируется моделью altglme.

results = compare(glme,altglme,Name,Value) возвращает результаты теста отношения правдоподобия с использованием дополнительных опций, указанных одним или несколькими Name,Value аргументы пары. Например, можно проверить, является ли первая входная модель glme, вложен во вторую входную модель, altglme.

Входные аргументы

развернуть все

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Можно создать GeneralizedLinearMixedModel объект путем подгонки обобщенной линейной модели смешанных эффектов к данным выборки с использованием fitglme. Чтобы провести допустимый тест отношения правдоподобия для двух моделей, которые имеют распределения отклика, отличные от нормального, необходимо подогнать обе модели с помощью 'ApproximateLaplace' или 'Laplace' способ подгонки. Модели с распределениями ответов, отличными от обычных, которые устанавливаются с использованием 'MPL' или 'REMPL' невозможно сравнить с помощью теста отношения правдоподобия.

`altglme` - Альтернативная обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

Альтернативная обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. altglme должно соответствовать тому же вектору отклика, что и glme, но с различными спецификациями модели. glme должен быть вложен в altglme, такой, что вы можете получить glme от altglme путем установки некоторых параметров модели altglme фиксированным значениям, таким как 0.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

`'CheckNesting'` - Индикатор для проверки вложенности между двумя моделями
`true` (по умолчанию) | `false`

Индикатор для проверки вложенности между двумя моделями, указанный как разделенная запятыми пара, состоящая из 'CheckNesting' и либо true или false. Если 'CheckNesting' является true, то compare проверяет, является ли модель меньшего размера glme вложен в большую модель altglme. Если требования к вложению не удовлетворены, то compare возвращает ошибку. Если 'CheckNesting' является false, то compare не выполняет эту проверку.

Пример: 'CheckNesting',true

Выходные аргументы

развернуть все

`results` - Результаты теста отношения правдоподобия
стол

Результаты теста отношения правдоподобия, возвращенные в виде таблицы с двумя строками. Первая строка предназначена для glme, и вторая строка для altglme. Столбцы results содержат следующее.

Имя столбца	Описание
`Model`	Имя модели
`DF`	Степени свободы
`AIC`	Информационный критерий Akaike для модели
`BIC`	Байесовский информационный критерий для модели
`LogLik`	Максимальная вероятность регистрации для модели
`LRStat`	Статистика теста отношения правдоподобия для сравнения `altglme` и `glme`
`deltaDF`	`DF` для `altglme` минус `DF` для `glme`
`pValue`	p-значение для теста отношения правдоподобия

Примеры

развернуть все

Сравнение моделей смешанных эффектов

Открыть сценарий в реальном времени

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

Флаг, указывающий, использовала ли партия новый процесс (newprocess)
Время обработки для каждой партии, в часах (time)
Температура партии, в градусах Цельсия (temp)
Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка модели только с фиксированными эффектами с помощью newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Укажите распределение ответа как Пуассон, функцию связи как log и метод аппроксимации как Лаплас. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

FEglme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Подгоните вторую модель, которая использует те же предикторы с фиксированными эффектами, распределение отклика, функцию связи и метод подгонки. На этот раз включите перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций.

Количество дефектов можно смоделировать с помощью распределения Пуассона

$_{} defectsij∼Poisson (_{} мкидж$ )

Это соответствует обобщенной линейной модели смешанных эффектов

$\log (_{} micij)_{=}_{β0} +_{}_{} {β1newprocessij +}_{} β2time_{_} {devij +}_{}_{} {β3temp _devij}_{+}_{} {β4supplier_}_{} {Cij}_{} +$ β5supplier _ Bij + bi,

где

$_{defectsij}$ - количество дефектов, наблюдаемых в партии, произведенной заводом $i$ во время партии $j$ .
$_{pciij}$ - среднее число дефектов, соответствующих заводу $i$ (где $i = 1,2, . . .,$ 20) во время партии j ( $где j = 1,2,$ ..., 5).
$_{newprocessij}$ , $_{time_devij}$ и $_{temp_devij}$ являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j $.$ Например, ${newprocessij}_{}$ указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.
$_{supplier_Cij}$ и $_{supplier_Bij}$ являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом $i$ во время партии $j$ .
$_{} bi∼N (0,_{}^{}$ startb2) - перехват случайных эффектов для каждой $фабрики$ i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Сравните две модели, используя теоретический тест отношения правдоподобия. Определить 'CheckNesting' как true, так compare возвращает предупреждение, если требования к вложению не удовлетворены.

results = compare(FEglme,glme,'CheckNesting',true)

results = 
    Theoretical Likelihood Ratio Test

    Model     DF    AIC       BIC       LogLik     LRStat    deltaDF
    FEglme    6     431.02    446.65    -209.51                     
    glme      7     416.35    434.58    -201.17    16.672    1      


    pValue    
              
    4.4435e-05

С тех пор compare не вернул ошибку, требования по вложению удовлетворены. Небольшое значение p указывает на то, что compare отвергает нулевую гипотезу о том, что наблюдаемый вектор ответа генерируется моделью FEglme, и вместо этого принимает альтернативную модель glme. Меньшее AIC и BIC значения для glme также поддержать вывод о том, что glme обеспечивает более подходящую модель для ответа.

Подробнее

развернуть все

Тест отношения правдоподобия

Тест отношения правдоподобия сравнивает спецификации двух вложенных моделей путем оценки значимости ограничений для расширенной модели с неограниченными параметрами. При нулевой гипотезе H0 проверочная статистика отношения правдоподобия имеет приблизительное хи-квадратичное опорное распределение со степенями свободы deltaDF.

При сравнении двух моделей compare вычисляет p-значение для теста отношения правдоподобия, сравнивая наблюдаемую статистику теста отношения правдоподобия с этим хи-квадратичным эталонным распределением. Небольшое значение p приводит к отказу от H0 в пользу H1 и принятию альтернативной модели altglme. С другой стороны, большое значение p указывает на то, что мы не можем отклонить H0, и отражает недостаточность доказательств для принятия модели altglme.

Значения p, полученные с использованием теста отношения правдоподобия, могут быть консервативными при тестировании на наличие или отсутствие терминов случайных эффектов и антиконсервативными при тестировании на наличие или отсутствие терминов с фиксированными эффектами. Вместо этого используйте fixedEffects или coefTest методы тестирования на фиксированные эффекты.

Чтобы провести допустимый тест отношения правдоподобия на моделях GLME, обе модели должны быть подогнаны с использованием метода Лапласа или аппроксимации Лапласа. Модели, настроенные с использованием метода максимального псевдоправдоподобия (MPL) или ограниченного максимального псевдправдоподобия (REMPL), не могут сравниваться с использованием теста отношения правдоподобия. При сравнении моделей, подогнанных с использованием MPL, в тесте отношения правдоподобия используется максимизированное логарифмическое правдоподобие псевдодат из окончательной псевдопонятной итерации. Если сравнивать модели с ненормальными распределениями, установленными с помощью MPL, то compare дает предупреждение о том, что тест отношения правдоподобия использует максимизированное логарифмическое правдоподобие псевдодат из окончательной псевдопонятной итерации. Чтобы использовать истинное максимизированное логарифмическое правдоподобие в тесте отношения правдоподобия, установите оба glme и altglme использование аппроксимации Лапласа или Лапласа перед сравнением модели.

Требования к вложению

Чтобы провести действительный тест отношения правдоподобия, glme должен быть вложен в altglme. 'CheckNesting',true аргумент пары «имя-значение» проверяет следующие требования и возвращает ошибку, если они не удовлетворяются:

Необходимо подогнать обе модели (glme и altglme) с использованием 'ApproximateLaplace' или 'Laplace' способ подгонки. Сравнение моделей GLME, установленных с помощью, невозможно 'MPL' или 'REMPL' с использованием теста отношения правдоподобия.
Необходимо подогнать обе модели, используя один и тот же вектор отклика, распределение отклика и функцию связи.
Модель меньшего размера (glme) должен быть вложен в большую модель (altglme), таким образом, что вы можете получить glme от altglme путем установки некоторых параметров модели altglme фиксированным значениям, таким как 0.
Максимальная логарифмическая вероятность более крупной модели (altglme) должно быть больше или равно максимизированной логарифмической вероятности модели меньшего размера (glme).
Векторы веса, используемые для подгонки glme и altglme должны быть идентичными.
Матрица проектирования случайных эффектов большей модели (altglme) должна содержать матрицу проектирования случайных эффектов модели меньшего размера (glme).
Матрица проектирования с фиксированными эффектами более крупной модели (altglme) должна содержать матрицу проектирования с фиксированными эффектами модели меньшего размера (glme).

Акайкэ и байесовские информационные критерии

Информационным критерием Акайке (AIC) является AIC = -2logLM + 2 (param).

logLM зависит от метода, используемого для подгонки модели.

Если вы используете 'Laplace' или 'ApproximateLaplace', то logLM является максимизированным логарифмическим правдоподобием.
Если вы используете 'MPL', то logLM является максимизированным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
Если вы используете 'REMPL', то logLM является максимизированным ограниченным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.

param - общее число параметров, оцененных в модели. Для большинства моделей GLME param равен nc + p + 1, где nc - общее число параметров в ковариации случайных эффектов, исключая остаточную дисперсию, а p - число коэффициентов фиксированных эффектов. Однако если параметр дисперсии зафиксирован на уровне 1,0 для биномиальных или пуассоновских распределений, то param равен (nc + p).

Байесовский информационный критерий (BIC) - BIC = -2 * logLM + ln _(neff) (param).

logLM зависит от метода, используемого для подгонки модели.

Если вы используете 'Laplace' или 'ApproximateLaplace', то logLM является максимизированным логарифмическим правдоподобием.
Если вы используете 'MPL', то logLM является максимизированным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
Если вы используете 'REMPL', то logLM является максимизированным ограниченным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.

_neff - это эффективное количество наблюдений.

Если вы используете 'MPL', 'Laplace', или 'ApproximateLaplace', то _neff = n, где n - число наблюдений.
Если вы используете 'REMPL', то _neff = n - p.

Меньшее значение отклонения указывает на лучшую подгонку. По мере уменьшения величины отклонения как AIC, так и BIC имеют тенденцию к снижению. Как AIC, так и BIC также включают штрафные сроки, основанные на количестве оцениваемых параметров, p. Таким образом, когда количество параметров увеличивается, значения AIC и BIC также имеют тенденцию увеличиваться. При сравнении различных моделей модель с наименьшим значением AIC или BIC рассматривается как наиболее подходящая модель.

Для моделей, устанавливаемых с использованием 'MPL' и 'REMPL'AIC и BIC основаны на логарифмическом правдоподобии (или ограниченном логарифмическом правдоподобии) псевдоданных из окончательной псевдопонятной итерации. Поэтому прямое сравнение значений AIC и BIC между моделями, установленными с использованием 'MPL' и 'REMPL' не подходит.

См. также

covarianceParameters | fixedEffects | GeneralizedLinearMixedModel | randomEffects

Документация

выдержать сравнение

Синтаксис

Описание

Входные аргументы

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

`altglme` - Альтернативная обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

Аргументы пары «имя-значение»

`'CheckNesting'` - Индикатор для проверки вложенности между двумя моделями
`true` (по умолчанию) | `false`

Выходные аргументы

`results` - Результаты теста отношения правдоподобия
стол

Примеры

Сравнение моделей смешанных эффектов

Подробнее

Тест отношения правдоподобия

Требования к вложению

Акайкэ и байесовские информационные критерии

См. также

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

выдержать сравнение

Синтаксис

Описание

Входные аргументы

glme - Обобщенная линейная модель смешанных эффектов GeneralizedLinearMixedModel объект

altglme - Альтернативная обобщенная линейная модель смешанных эффектов GeneralizedLinearMixedModel объект

Аргументы пары «имя-значение»

'CheckNesting' - Индикатор для проверки вложенности между двумя моделями true (по умолчанию) | false

Выходные аргументы

results - Результаты теста отношения правдоподобия стол

Примеры

Сравнение моделей смешанных эффектов

Подробнее

Тест отношения правдоподобия

Требования к вложению

Акайкэ и байесовские информационные критерии

См. также

Документация по инструментам для статистического и машинного обучения

Поддержка

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

`altglme` - Альтернативная обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

`'CheckNesting'` - Индикатор для проверки вложенности между двумя моделями
`true` (по умолчанию) | `false`

`results` - Результаты теста отношения правдоподобия
стол