coefTest

Класс: GeneralizedLinearMixedModel

Тест гипотезы на фиксированных и случайных эффектах обобщенной модели линейных смешанных эффектов

Описание

пример

pVal = coefTest(glme) возвращает p -value F -test нулевой гипотезы о том, что все коэффициенты с фиксированными эффектами обобщенной модели линейных смешанных эффектов glme, кроме точки пересечения, равны 0.

пример

pVal = coefTest(glme,H) возвращает p -value F -test с помощью заданной контрастной матрицы, H. Нулевая гипотеза H0: H β = 0, где β является вектором с фиксированными эффектами.

pVal = coefTest(glme,H,C) возвращает p -value для F -test с использованием гипотезированного значения, C. Нулевая гипотеза H0: H β = C, где β является вектором с фиксированными эффектами.

pVal = coefTest(glme,H,C,Name,Value) возвращает p -value для F -test на коэффициентах фиксированных - и/или случайных эффектов обобщенной модели линейных смешанных эффектов glme, с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно задать метод для вычисления приблизительных степеней свободы знаменателя для F -test.

пример

[pVal,F,DF1,DF2] = coefTest(___) также возвращает F -statistic, F, и числитель и знаменатель степеней свободы для F, соответственно DF1 и DF2, с использованием любого из предыдущих синтаксисов.

Входные параметры

расширить все

Обобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel.

Фиксированные эффекты контрастируют, заданные как m -by p матрица, где p - количество коэффициентов с фиксированными эффектами в glme. Каждая строка H представляет один контраст. Столбцы H (слева направо) соответствуют строкам вектора p -by-1 с фиксированными эффектами beta (сверху вниз), оценка которого возвращается fixedEffects способ.

Типы данных: single | double

Гипотезированное значение для проверки нулевой гипотезы H β = C, заданное как вектор m -by-1. Здесь β является вектором фиксированных эффектов, оценка которых возвращается по fixedEffects.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Метод для вычисления приблизительных степеней свободы, заданный как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Степени свободы значения приняты постоянными и равными n - p, где n - количество наблюдений и p - количество фиксированных эффектов.
'none'Степени свободы заданы как бесконечность.

Пример: 'DFMethod','none'

Случайные эффекты контрастируют, заданные как разделенная разделенными запятой парами, состоящая из 'REContrast' и m -by - q матрица, где q - количество параметров случайных эффектов в glme. Столбцы матрицы (слева направо) соответствуют строкам вектора случайных эффектов q -by-1 B (сверху вниз), оценка которого возвращается randomEffects способ.

Типы данных: single | double

Выходные аргументы

расширить все

p -value для F -test на коэффициентах фиксированных - и/или случайных эффектов обобщенной модели линейных смешанных эффектов glme, возвращается как скалярное значение.

При подборе модели GLME используя fitglme и один из максимальных методов подгонки правдоподобия ('Laplace' или 'ApproximateLaplace'), coefTest использует приближение условной средней квадратичной невязки предсказания (CMSEP) предполагаемой линейной комбинации фиксированных и случайных эффектов для вычисления p значений. Это учитывает неопределенность в оценках фиксированных эффектов, но не в оценках ковариационных параметров. Для тестов только на фиксированные эффекты, если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" в fitglme как 'JointHessian', затем coefTest учитывает неопределенность в оценке ковариационных параметров.

При подборе модели GLME используя fitglme и один из методов подгонки псевдоправдоподобия ('MPL' или 'REMPL'), coefTest основывает вывод на модели подобранных линейных смешанных эффектов из окончательной итерации псевдоправдоподобия.

F -статистический, возвращенный как скалярное значение.

Числитель степеней свободы для F -статистического F, возвращается как скалярное значение.

  • Если Вы проверяете нулевую гипотезу H0: <reservedrangesplaceholder5> <reservedrangesplaceholder4> = 0 или H0: <reservedrangesplaceholder3> <reservedrangesplaceholder2> = C, тогда DF1 равно количеству линейно независимых строк в H.

  • Если Вы проверяете нулевую гипотезу H0: <reservedrangesplaceholder4> <reservedrangesplaceholder3> + KB = C, тогда DF1 равно количеству линейно независимых строк в [H,K].

Знаменательные степени свободы для F -статистического F, возвращается как скалярное значение. Значение DF2 зависит от опции, заданной в 'DFMethod' аргумент пары "имя-значение".

Примеры

расширить все

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите точку пересечения случайных эффектов, сгруппированный по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной модели линейных смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Проверка наличия существенного различия между поставщиком C и поставщиком B.

H = [0,0,0,0,1,-1];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.2793
F = 1.1842
DF1 = 1
DF2 = 94

Большое p- значение указывает на отсутствие существенного различия между поставщиком C и поставщиком B на уровне значимости 5%. Здесь, coefTest также возвращает F-statistic, степени свободы числителя и приблизительные степени свободы знаменателя.

Проверка наличия существенного различия между поставщиком A и поставщиком B.

Если вы задаете 'DummyVarCoding' аргумент пары "имя-значение" как 'effects' при подгонке модели с помощью fitglme, затем

βA+βB+βC=0,

где βA, βB, и βC соответствуют поставщикам A, B и C, соответственно. βA - эффект A минус средний эффект A, B и C. Для определения контрастной матрицы, соответствующей тесту между поставщиком A и поставщиком B,

βB-βA=βB-(-βB-βC)=2βB+βC.

Из выхода disp(glme), столбец 5 контрастной матрицы соответствует βC, а столбец 6 соответствует βB. Поэтому контрастная матрица для этого теста задана как H = [0,0,0,0,1,2].

H = [0,0,0,0,1,2];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.6177
F = 0.2508
DF1 = 1
DF2 = 94

Большое p- значение указывает на отсутствие существенного различия между поставщиком A и поставщиком B на уровне значимости 5%.

Ссылки

[1] Booth, J.G., and J.P. Хоберт. Стандартные ошибки предсказания в обобщенных линейных смешанных моделях. Журнал Американской статистической ассоциации, том 93, 1998, стр. 262-272.