Класс: модель GeneralizedLinearDepartedModel
Сравнение обобщенных линейных моделей смешанных эффектов
возвращает результаты теста отношения правдоподобия, который сравнивает обобщенные линейные модели смешанных эффектов results = compare(glme,altglme)glme и altglme. Чтобы провести допустимый тест отношения правдоподобия, обе модели должны использовать один и тот же вектор отклика в подгонке, и glme должен быть вложен в altglme. Всегда вводите сначала модель меньшего размера, а затем модель большего размера.
compare проверяет следующие нулевые и альтернативные гипотезы:
H0: Наблюдаемый вектор отклика генерируется glme.
H1: Наблюдаемый вектор отклика генерируется моделью altglme.
возвращает результаты теста отношения правдоподобия с использованием дополнительных опций, указанных одним или несколькими results = compare(glme,altglme,Name,Value)Name,Value аргументы пары. Например, можно проверить, является ли первая входная модель glme, вложен во вторую входную модель, altglme.
glme - Обобщенная линейная модель смешанных эффектовGeneralizedLinearMixedModel объектОбобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.
Можно создать GeneralizedLinearMixedModel объект путем подгонки обобщенной линейной модели смешанных эффектов к данным выборки с использованием fitglme. Чтобы провести допустимый тест отношения правдоподобия для двух моделей, которые имеют распределения отклика, отличные от нормального, необходимо подогнать обе модели с помощью 'ApproximateLaplace' или 'Laplace' способ подгонки. Модели с распределениями ответов, отличными от обычных, которые устанавливаются с использованием 'MPL' или 'REMPL' невозможно сравнить с помощью теста отношения правдоподобия.
altglme - Альтернативная обобщенная линейная модель смешанных эффектовGeneralizedLinearMixedModel объектАльтернативная обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. altglme должно соответствовать тому же вектору отклика, что и glme, но с различными спецификациями модели. glme должен быть вложен в altglme, такой, что вы можете получить glme от altglme путем установки некоторых параметров модели altglme фиксированным значениям, таким как 0.
Можно создать GeneralizedLinearMixedModel объект путем подгонки обобщенной линейной модели смешанных эффектов к данным выборки с использованием fitglme. Чтобы провести допустимый тест отношения правдоподобия для двух моделей, которые имеют распределения отклика, отличные от нормального, необходимо подогнать обе модели с помощью 'ApproximateLaplace' или 'Laplace' способ подгонки. Модели с распределениями ответов, отличными от обычных, которые устанавливаются с использованием 'MPL' или 'REMPL' невозможно сравнить с помощью теста отношения правдоподобия.
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
'CheckNesting' - Индикатор для проверки вложенности между двумя моделямиtrue (по умолчанию) | falseИндикатор для проверки вложенности между двумя моделями, указанный как разделенная запятыми пара, состоящая из 'CheckNesting' и либо true или false. Если 'CheckNesting' является true, то compare проверяет, является ли модель меньшего размера glme вложен в большую модель altglme. Если требования к вложению не удовлетворены, то compare возвращает ошибку. Если 'CheckNesting' является false, то compare не выполняет эту проверку.
Пример: 'CheckNesting',true
results - Результаты теста отношения правдоподобияРезультаты теста отношения правдоподобия, возвращенные в виде таблицы с двумя строками. Первая строка предназначена для glme, и вторая строка для altglme. Столбцы results содержат следующее.
| Имя столбца | Описание |
|---|---|
Model | Имя модели |
DF | Степени свободы |
AIC | Информационный критерий Akaike для модели |
BIC | Байесовский информационный критерий для модели |
LogLik | Максимальная вероятность регистрации для модели |
LRStat | Статистика теста отношения правдоподобия для сравнения altglme и glme |
deltaDF | DF для altglme минус DF для glme |
pValue | p-значение для теста отношения правдоподобия |
Загрузите образцы данных.
load mfrЭти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:
Флаг, указывающий, использовала ли партия новый процесс (newprocess)
Время обработки для каждой партии, в часах (time)
Температура партии, в градусах Цельсия (temp)
Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)
Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.
Подгонка модели только с фиксированными эффектами с помощью newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Укажите распределение ответа как Пуассон, функцию связи как log и метод аппроксимации как Лаплас. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.
FEglme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
Подгоните вторую модель, которая использует те же предикторы с фиксированными эффектами, распределение отклика, функцию связи и метод подгонки. На этот раз включите перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций.
Количество дефектов можно смоделировать с помощью распределения Пуассона
)
Это соответствует обобщенной линейной модели смешанных эффектов
β5supplier _ Bij + bi,
где
- количество дефектов, наблюдаемых в партии, произведенной заводом во время партии .
- среднее число дефектов, соответствующих заводу (где 20) во время партии j (..., 5).
, и являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии jНапример, указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.
и являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом во время партии .
startb2) - перехват случайных эффектов для каждой i, который учитывает специфичные для фабрики вариации качества.
glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
Сравните две модели, используя теоретический тест отношения правдоподобия. Определить 'CheckNesting' как true, так compare возвращает предупреждение, если требования к вложению не удовлетворены.
results = compare(FEglme,glme,'CheckNesting',true)results =
Theoretical Likelihood Ratio Test
Model DF AIC BIC LogLik LRStat deltaDF
FEglme 6 431.02 446.65 -209.51
glme 7 416.35 434.58 -201.17 16.672 1
pValue
4.4435e-05
С тех пор compare не вернул ошибку, требования по вложению удовлетворены. Небольшое значение p указывает на то, что compare отвергает нулевую гипотезу о том, что наблюдаемый вектор ответа генерируется моделью FEglme, и вместо этого принимает альтернативную модель glme. Меньшее AIC и BIC значения для glme также поддержать вывод о том, что glme обеспечивает более подходящую модель для ответа.
Тест отношения правдоподобия сравнивает спецификации двух вложенных моделей путем оценки значимости ограничений для расширенной модели с неограниченными параметрами. При нулевой гипотезе H0 проверочная статистика отношения правдоподобия имеет приблизительное хи-квадратичное опорное распределение со степенями свободы deltaDF.
При сравнении двух моделей compare вычисляет p-значение для теста отношения правдоподобия, сравнивая наблюдаемую статистику теста отношения правдоподобия с этим хи-квадратичным эталонным распределением. Небольшое значение p приводит к отказу от H0 в пользу H1 и принятию альтернативной модели altglme. С другой стороны, большое значение p указывает на то, что мы не можем отклонить H0, и отражает недостаточность доказательств для принятия модели altglme.
Значения p, полученные с использованием теста отношения правдоподобия, могут быть консервативными при тестировании на наличие или отсутствие терминов случайных эффектов и антиконсервативными при тестировании на наличие или отсутствие терминов с фиксированными эффектами. Вместо этого используйте fixedEffects или coefTest методы тестирования на фиксированные эффекты.
Чтобы провести допустимый тест отношения правдоподобия на моделях GLME, обе модели должны быть подогнаны с использованием метода Лапласа или аппроксимации Лапласа. Модели, настроенные с использованием метода максимального псевдоправдоподобия (MPL) или ограниченного максимального псевдправдоподобия (REMPL), не могут сравниваться с использованием теста отношения правдоподобия. При сравнении моделей, подогнанных с использованием MPL, в тесте отношения правдоподобия используется максимизированное логарифмическое правдоподобие псевдодат из окончательной псевдопонятной итерации. Если сравнивать модели с ненормальными распределениями, установленными с помощью MPL, то compare дает предупреждение о том, что тест отношения правдоподобия использует максимизированное логарифмическое правдоподобие псевдодат из окончательной псевдопонятной итерации. Чтобы использовать истинное максимизированное логарифмическое правдоподобие в тесте отношения правдоподобия, установите оба glme и altglme использование аппроксимации Лапласа или Лапласа перед сравнением модели.
Чтобы провести действительный тест отношения правдоподобия, glme должен быть вложен в altglme. 'CheckNesting',true аргумент пары «имя-значение» проверяет следующие требования и возвращает ошибку, если они не удовлетворяются:
Необходимо подогнать обе модели (glme и altglme) с использованием 'ApproximateLaplace' или 'Laplace' способ подгонки. Сравнение моделей GLME, установленных с помощью, невозможно 'MPL' или 'REMPL' с использованием теста отношения правдоподобия.
Необходимо подогнать обе модели, используя один и тот же вектор отклика, распределение отклика и функцию связи.
Модель меньшего размера (glme) должен быть вложен в большую модель (altglme), таким образом, что вы можете получить glme от altglme путем установки некоторых параметров модели altglme фиксированным значениям, таким как 0.
Максимальная логарифмическая вероятность более крупной модели (altglme) должно быть больше или равно максимизированной логарифмической вероятности модели меньшего размера (glme).
Векторы веса, используемые для подгонки glme и altglme должны быть идентичными.
Матрица проектирования случайных эффектов большей модели (altglme) должна содержать матрицу проектирования случайных эффектов модели меньшего размера (glme).
Матрица проектирования с фиксированными эффектами более крупной модели (altglme) должна содержать матрицу проектирования с фиксированными эффектами модели меньшего размера (glme).
Информационным критерием Акайке (AIC) является AIC = -2logLM + 2 (param).
logLM зависит от метода, используемого для подгонки модели.
Если вы используете 'Laplace' или 'ApproximateLaplace', то logLM является максимизированным логарифмическим правдоподобием.
Если вы используете 'MPL', то logLM является максимизированным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
Если вы используете 'REMPL', то logLM является максимизированным ограниченным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
param - общее число параметров, оцененных в модели. Для большинства моделей GLME param равен nc + p + 1, где nc - общее число параметров в ковариации случайных эффектов, исключая остаточную дисперсию, а p - число коэффициентов фиксированных эффектов. Однако если параметр дисперсии зафиксирован на уровне 1,0 для биномиальных или пуассоновских распределений, то param равен (nc + p).
Байесовский информационный критерий (BIC) - BIC = -2 * logLM + ln (neff) (param).
logLM зависит от метода, используемого для подгонки модели.
Если вы используете 'Laplace' или 'ApproximateLaplace', то logLM является максимизированным логарифмическим правдоподобием.
Если вы используете 'MPL', то logLM является максимизированным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
Если вы используете 'REMPL', то logLM является максимизированным ограниченным логарифмическим правдоподобием псевдоданных из окончательной псевдопонятной итерации.
neff - это эффективное количество наблюдений.
Если вы используете 'MPL', 'Laplace', или 'ApproximateLaplace', то neff = n, где n - число наблюдений.
Если вы используете 'REMPL', то neff = n - p.
param - общее число параметров, оцененных в модели. Для большинства моделей GLME param равен nc + p + 1, где nc - общее число параметров в ковариации случайных эффектов, исключая остаточную дисперсию, а p - число коэффициентов фиксированных эффектов. Однако если параметр дисперсии зафиксирован на уровне 1,0 для биномиальных или пуассоновских распределений, то param равен (nc + p).
Меньшее значение отклонения указывает на лучшую подгонку. По мере уменьшения величины отклонения как AIC, так и BIC имеют тенденцию к снижению. Как AIC, так и BIC также включают штрафные сроки, основанные на количестве оцениваемых параметров, p. Таким образом, когда количество параметров увеличивается, значения AIC и BIC также имеют тенденцию увеличиваться. При сравнении различных моделей модель с наименьшим значением AIC или BIC рассматривается как наиболее подходящая модель.
Для моделей, устанавливаемых с использованием 'MPL' и 'REMPL'AIC и BIC основаны на логарифмическом правдоподобии (или ограниченном логарифмическом правдоподобии) псевдоданных из окончательной псевдопонятной итерации. Поэтому прямое сравнение значений AIC и BIC между моделями, установленными с использованием 'MPL' и 'REMPL' не подходит.
covarianceParameters | fixedEffects | GeneralizedLinearMixedModel | randomEffects
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.