exponenta event banner

coefTest

Класс: модель GeneralizedLinearDepartedModel

Тест гипотез о фиксированных и случайных эффектах обобщенной линейной модели смешанных эффектов

Описание

пример

pVal = coefTest(glme) возвращает значение p F-теста нулевой гипотезы о том, что все коэффициенты с фиксированными эффектами обобщенной линейной модели с смешанными эффектами glme, за исключением перехвата, равны 0.

пример

pVal = coefTest(glme,H) возвращает значение p F-теста с использованием заданной контрастной матрицы, H. Нулевая гипотеза H0: = 0, где β - вектор с фиксированными эффектами.

pVal = coefTest(glme,H,C) возвращает значение p для F-теста с использованием гипотетического значения, C. Нулевая гипотеза H0: = C, где β - вектор с фиксированными эффектами.

pVal = coefTest(glme,H,C,Name,Value) возвращает значение p для F-теста для коэффициентов фиксированных и/или случайных эффектов обобщенной линейной модели смешанных эффектов glme, с дополнительными параметрами, заданными одним или несколькими аргументами пары имя-значение. Например, можно задать метод вычисления приближенных степеней свободы знаменателя для F-теста.

пример

[pVal,F,DF1,DF2] = coefTest(___) также возвращает F-статистику, Fи степени свободы числителя и знаменателя для F, соответственно DF1 и DF2, используя любой из предыдущих синтаксисов.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Контрасты с фиксированными эффектами, определенные как матрица m-by-p, где p - количество коэффициентов с фиксированными эффектами в glme. Каждая строка H представляет один контраст. Столбцы H (слева направо) соответствуют строкам вектора фиксированных эффектов p-by-1 beta (сверху вниз), чья оценка возвращается fixedEffects способ.

Типы данных: single | double

Гипотетическое значение для проверки нулевой гипотезы = C, указанное как вектор m-by-1. Здесь β является вектором фиксированных эффектов, оценка которых возвращается fixedEffects.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Метод вычисления приблизительных степеней свободы, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

СтоимостьОписание
'residual'Значение степеней свободы принимается постоянным и равным n - p, где n - число наблюдений, а p - число фиксированных эффектов.
'none'Степени свободы устанавливаются на бесконечность.

Пример: 'DFMethod','none'

Контрасты случайных эффектов, определяемые как пара, разделенная запятыми, состоящая из 'REContrast' и матрицу m-на-q, где q - число параметров случайных эффектов в glme. Столбцы матрицы (слева направо) соответствуют строкам вектора случайных эффектов q-by-1 B (сверху вниз), чья оценка возвращается randomEffects способ.

Типы данных: single | double

Выходные аргументы

развернуть все

p-значение для F-теста по коэффициентам фиксированных и/или случайных эффектов обобщенной линейной модели смешанных эффектов glme, возвращается как скалярное значение.

При подгонке модели GLME с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'), coefTest использует аппроксимацию условной среднеквадратичной ошибки прогнозирования (CMSEP) оцененной линейной комбинации фиксированных и случайных эффектов для вычисления p-значений. Это объясняет неопределенность в оценках фиксированных эффектов, но не неопределенность в оценках ковариационных параметров. Только для тестов с фиксированными эффектами, если указан 'CovarianceMethod' аргумент пары имя-значение в fitglme как 'JointHessian', то coefTest учитывает неопределенность в оценке параметров ковариации.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), coefTest основывает вывод на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

F-статистика, возвращаемая как скалярное значение.

Числительные степени свободы для F-статистики F, возвращается как скалярное значение.

  • Если проверить нулевую гипотезу H0: = 0 или H0: = C, то DF1 равно числу линейно независимых строк в H.

  • Если проверить нулевую гипотезу H0: + KB = C, то DF1 равно числу линейно независимых строк в [H,K].

Степени свободы знаменателя для F-статистики F, возвращается как скалярное значение. Значение DF2 зависит от опции, указанной 'DFMethod' аргумент пары имя-значение.

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,.. ., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Проверка наличия существенных различий между поставщиком C и поставщиком B.

H = [0,0,0,0,1,-1];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.2793
F = 1.1842
DF1 = 1
DF2 = 94

Большое значение p указывает на отсутствие существенной разницы между поставщиком C и поставщиком B на уровне значимости 5%. Здесь, coefTest также возвращает F-статистику, числительные степени свободы и приближенные знаменательные степени свободы.

Проверка наличия существенных различий между поставщиком A и поставщиком B.

При указании 'DummyVarCoding' аргумент пары имя-значение как 'effects' при подгонке модели с использованием fitglme, то

βA + βB + βC = 0,

где βA, βB и βC соответствуют поставщикам A, B и C соответственно. βA - эффект А минус средний эффект А, В и С. Для определения контрастной матрицы, соответствующей тесту между поставщиком А и поставщиком В,

βB-βA = βB- (-βB-βC) = 2βB + βC.

Из выходных данных disp(glme)столбец 5 контрастной матрицы соответствует βC, а столбец 6 соответствует βB. Поэтому контрастная матрица для этого теста указана как H = [0,0,0,0,1,2].

H = [0,0,0,0,1,2];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.6177
F = 0.2508
DF1 = 1
DF2 = 94

Большое значение p указывает на отсутствие существенной разницы между поставщиком A и поставщиком B на уровне значимости 5%.

Ссылки

[1] Бут, Дж.Г. и Дж.П. Хоберт. «Стандартные ошибки прогнозирования в обобщенных линейных смешанных моделях». Журнал Американской статистической ассоциации, том 93, 1998, стр. 262-272.