Класс: GeneralizedLinearMixedModel
Сравнение обобщенных линейных моделей смешанных эффектов
возвращает результаты теста коэффициента правдоподобия, который сравнивает обобщенные линейные модели смешанных эффектов results
= compare(glme
,altglme
)glme
и altglme
. Чтобы провести допустимый тест коэффициента правдоподобия, обе модели должны использовать один и тот же вектор отклика в подгонке и glme
должен быть вложен в altglme
. Всегда вводите первую меньшую модель, а вторую большую модель.
compare
проверяет следующие нулевые и альтернативные гипотезы:
H 0: Вектор наблюдаемой реакции генерируется glme
.
H 1: Вектор наблюдаемой реакции генерируется моделью altglme
.
возвращает результаты теста коэффициента правдоподобия с помощью дополнительных опций, заданных одним или несколькими results
= compare(glme
,altglme
,Name,Value
)Name,Value
аргументы в виде пар. Для примера можно проверить, является ли первая модель входа, glme
, вложен во вторую входную модель, altglme
.
glme
- Обобщенная линейная модель смешанных эффектовGeneralizedLinearMixedModel
объектОбобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel
объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel
.
Можно создать GeneralizedLinearMixedModel
объект путем подгонки обобщенной линейной модели смешанных эффектов к выборочным данным с помощью fitglme
. Чтобы провести допустимый тест коэффициента правдоподобия на двух моделях, которые имеют распределения отклика, отличные от нормальных, вы должны подогнать обе модели, используя 'ApproximateLaplace'
или 'Laplace'
метод подгонки. Модели с распределениями отклика, отличными от нормальных, которые устанавливаются с помощью 'MPL'
или 'REMPL'
невозможно сравнить с помощью теста коэффициента вероятности.
altglme
- Альтернативная обобщенная линейная модель смешанных эффектовGeneralizedLinearMixedModel
объектАльтернативная обобщенная линейная модель смешанных эффектов, заданная как GeneralizedLinearMixedModel
объект. altglme
be должен соответствовать тому же вектору отклика, что и glme
, но с другими спецификациями модели. glme
должен быть вложен в altglme
, таким образом можно получить glme
от altglme
путем установки некоторых параметров модели altglme
к фиксированным значениям, таким как 0.
Можно создать GeneralizedLinearMixedModel
объект путем подгонки обобщенной линейной модели смешанных эффектов к выборочным данным с помощью fitglme
. Чтобы провести допустимый тест коэффициента правдоподобия на двух моделях, которые имеют распределения отклика, отличные от нормальных, вы должны подогнать обе модели, используя 'ApproximateLaplace'
или 'Laplace'
метод подгонки. Модели с распределениями отклика, отличными от нормальных, которые устанавливаются с помощью 'MPL'
или 'REMPL'
невозможно сравнить с помощью теста коэффициента вероятности.
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
'CheckNesting'
- Индикатор для проверки вложенности между двумя моделямиtrue
(по умолчанию) | false
Индикатор для проверки вложенности между двумя моделями, заданный как разделенная разделенными запятой парами, состоящая из 'CheckNesting'
и любой из них true
или false
. Если 'CheckNesting'
является true
, затем compare
проверяет, является ли модель меньшей glme
вложен в большую модель altglme
. Если требования к вложенности не выполняются, то compare
возвращает ошибку. Если 'CheckNesting'
является false
, затем compare
не выполняет эту проверку.
Пример: 'CheckNesting',true
results
- Результаты проверки коэффициента вероятностиРезультаты теста коэффициента правдоподобия, возвращенные как таблица с двумя строками. Первая строка предназначена для glme
, и вторая строка предназначена для altglme
. Столбцы results
содержать следующее.
Имя столбца | Описание |
---|---|
Model | Имя модели |
DF | Степени свободы |
AIC | Информационный критерий Акайке для модели |
BIC | Байесовский информационный критерий для модели |
LogLik | Максимизированная журналом вероятность для модели |
LRStat | Статистика теста коэффициента правдоподобия для сравнения altglme и glme |
deltaDF | DF для altglme минус DF для glme |
pValue | p -значение для теста коэффициента правдоподобия |
Загрузите выборочные данные.
load mfr
Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:
Флаг, указывающий, использовал ли пакет новый процесс (newprocess
)
Время вычислений для каждой партии, в часах (time
)
Температура партии, в степенях Цельсия (temp
)
Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier
)
Количество дефектов в партии (defects
)
Данные также включают time_dev
и temp_dev
, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.
Подбор модели только для фиксированных эффектов с помощью newprocess
, time_dev
, temp_dev
, и supplier
как предикторы фиксированных эффектов. Укажите распределение отклика как Poisson, функцию link - как журнал, а метод fit - как Laplace. Задайте кодировку фиктивной переменной следующим 'effects'
, поэтому фиктивные переменные коэффициенты равны 0.
FEglme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
Подгонка второй модели, которая использует те же предикторы с фиксированными эффектами, распределение отклика, функцию ссылки и метод подгонки. На этот раз включите точку пересечения случайных эффектов, сгруппированный по factory
, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений.
Количество дефектов может быть смоделировано с помощью распределения Пуассона
Это соответствует обобщенной модели линейных смешанных эффектов
где
количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем во время партии .
- среднее количество дефектов, соответствующих заводу (где ) во время партии (где ).
, , и являются измерениями для каждой переменной, которые соответствуют фабрике во время партии . Для примера, указывает, производится ли партия заводом-изготовителем во время партии использовали новый процесс.
и являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C
или B
, соответственно, поставила химикаты для партии, произведенной заводом во время партии .
является точка пересечения случайных эффектов для каждого завода который учитывает специфические для завода изменения в качестве.
glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');
Сравните две модели с помощью теоретического теста коэффициента правдоподобия. Задайте 'CheckNesting'
как true
, так compare
возвращает предупреждение, если требования к вложенности не удовлетворены.
results = compare(FEglme,glme,'CheckNesting',true)
results = Theoretical Likelihood Ratio Test Model DF AIC BIC LogLik LRStat deltaDF FEglme 6 431.02 446.65 -209.51 glme 7 416.35 434.58 -201.17 16.672 1 pValue 4.4435e-05
Начиная с compare
не вернул ошибку, требования к вложенности удовлетворены. Маленькое -значение указывает, что compare
отклоняет нулевую гипотезу о том, что вектор наблюдаемой реакции генерируется моделью FEglme
, и вместо этого принимает альтернативную модель glme
. Меньшая AIC
и BIC
значения для glme
также подтверждаем вывод о том, что glme
обеспечивает лучшую модель аппроксимации для отклика.
Тест коэффициента правдоподобия сравнивает спецификации двух вложенных моделей путем оценки значимости ограничений с расширенной моделью с неограниченными параметрами. Согласно нулевой гипотезе H 0, тестовая статистическая величина отношения правдоподобия имеет приблизительную хи-квадратичную ссылку распределение со степенями свободы deltaDF
.
При сравнении двух моделей compare
вычисляет p-значение для теста коэффициента правдоподобия путем сравнения тестовой статистики наблюдаемого коэффициента правдоподобия с этим хи-квадратным эталонным распределением. Небольшое p -значение приводит к отклонению H 0 в пользу H 1 и принятию альтернативной модели altglme
. С другой стороны, большое значение p указывает, что мы не можем отклонить H 0, и отражает недостаточное количество доказательств, чтобы принять модель altglme
.
Значения p, полученные с использованием теста коэффициента вероятности, могут быть консервативными при тестировании на наличие или отсутствие терминов случайных эффектов и антиконсервативными при тестировании на наличие или отсутствие терминов фиксированных эффектов. Вместо этого используйте fixedEffects
или coefTest
методы для тестирования на фиксированные эффекты.
Чтобы провести действительный тест коэффициента правдоподобия на моделях GLME, обе модели должны быть установлены с помощью метода Laplace или приблизительного полинома Laplace. Модели, подобранные с использованием метода максимальной псевдоподобности (MPL) или ограниченного максимального псевдоподобия (REMPL), не могут быть сравнены с помощью теста коэффициента правдоподобия. При сравнении моделей, подобранных с использованием MPL, в тесте коэффициента вероятности используется максимальный журнал вероятность псевдоданных от окончательной итерации псевдоправдоподобия. Если вы сравниваете модели с ненормальными распределениями, установленными с помощью MPL, то compare
приводит предупреждение о том, что тест коэффициента вероятности использует максимальный журнал вероятность псевдоданных от окончательной итерации псевдоправдоподобия. Чтобы использовать истинную максимизированную журналом правдоподобность в тесте коэффициента вероятности, подбирайте обе glme
и altglme
использование приблизительных Laplace или Laplace до сравнения моделей.
Чтобы провести допустимый тест коэффициента правдоподобия, glme
должен быть вложен в altglme
. The 'CheckNesting',true
аргумент пары "имя-значение" проверяет следующие требования и возвращает ошибку, если она не удовлетворена:
Вы должны подогнать обе модели (glme
и altglme
) использование 'ApproximateLaplace'
или 'Laplace'
метод подгонки. Вы не можете сравнить модели GLME, установленные с помощью 'MPL'
или 'REMPL'
использование теста коэффициента вероятности.
Вы должны подогнать обе модели с помощью одного вектора отклика, распределения отклика и функции ссылки.
Меньшая модель (glme
) должны быть вложены в большую модель (altglme
), таким образом можно получить glme
от altglme
путем установки некоторых параметров модели altglme
к фиксированным значениям, таким как 0.
Максимальный журнал вероятность большей модели (altglme
) должно быть больше или равно максимального журнала вероятности меньшей модели (glme
).
Векторы веса, используемые для аппроксимации glme
и altglme
должны быть идентичными.
Матрица проекта случайных эффектов большей модели (altglme
) должна содержать матрицу разработки случайных эффектов меньшей модели (glme
).
Матрица проекта фиксированных эффектов большей модели (altglme
) должна содержать матрицу проекта с фиксированными эффектами меньшей модели (glme
).
Информационный критерий Akaike (AIC) равен AIC = -2log L M + 2 (param).
Журнал L M зависит от метода, используемого для подгонки модели.
Если вы используете 'Laplace'
или 'ApproximateLaplace'
, затем журнал L M является максимальным журналом вероятностью.
Если вы используете 'MPL'
, затем журнал L M является максимальным журналом вероятностью псевдослучайных данных от конечной итерации псевдоправдоподобия.
Если вы используете 'REMPL'
, затем журнал L M является максимизированной ограниченным журналом вероятностью псевдослучайных данных от конечной итерации псевдоправдоподобия.
param - общее количество параметров, оцененных в модели. Для большинства моделей GLME param равно nc + p + 1, где nc - общее количество параметров в ковариации случайных эффектов, исключая остаточное отклонение, и p - количество коэффициентов с фиксированными эффектами. Однако, если параметр дисперсии зафиксирован на 1,0 для биномиальных или Пуассоновых распределений, то param равно (nc + p).
Байесовский информационный критерий (BIC) равен BIC = -2 * журналу L M + ln (neff) (param).
Журнал L M зависит от метода, используемого для подгонки модели.
Если вы используете 'Laplace'
или 'ApproximateLaplace'
, затем журнал L M является максимальным журналом вероятностью.
Если вы используете 'MPL'
, затем журнал L M является максимальным журналом вероятностью псевдослучайных данных от конечной итерации псевдоправдоподобия.
Если вы используете 'REMPL'
, затем журнал L M является максимизированной ограниченным журналом вероятностью псевдослучайных данных от конечной итерации псевдоправдоподобия.
neff - эффективное количество наблюдений.
Если вы используете 'MPL'
, 'Laplace'
, или 'ApproximateLaplace'
, тогда neff = n, где n - количество наблюдений.
Если вы используете 'REMPL'
, затем neff = n - p.
param - общее количество параметров, оцененных в модели. Для большинства моделей GLME param равно nc + p + 1, где nc - общее количество параметров в ковариации случайных эффектов, исключая остаточное отклонение, и p - количество коэффициентов с фиксированными эффектами. Однако, если параметр дисперсии зафиксирован на 1,0 для биномиальных или Пуассоновых распределений, то param равно (nc + p).
Меньшее значение отклонения указывает на лучшую подгонку. Когда значение отклонения уменьшается, и AIC, и BIC имеют тенденцию уменьшаться. И AIC, и BIC также включают условия штрафа, основанные на количестве параметров, оцененных, p. Таким образом, когда количество параметров увеличивается, значения AIC и BIC также имеют тенденцию увеличиваться. При сравнении различных моделей модель с самым низким значением AIC или BIC рассматривается как лучшая модель аппроксимации.
Для моделей, установленных с использованием 'MPL'
и 'REMPL'
AIC и BIC основаны на журнале вероятности (или ограниченного журнала вероятности) псевдослучайных данных от окончательной итерации псевдослучайности. Поэтому прямое сравнение значений AIC и BIC между моделями, подобранными с помощью 'MPL'
и 'REMPL'
не подходит.
covarianceParameters
| fixedEffects
| GeneralizedLinearMixedModel
| randomEffects
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.