coefTest

Класс: модель GeneralizedLinearDepartedModel

Тест гипотез о фиксированных и случайных эффектах обобщенной линейной модели смешанных эффектов

развернуть все на странице

Синтаксис

pVal = coefTest (glme)

pVal = coefTest (glme, H)

pVal = coefTest (glme, H, C)

pVal = coefTest (glme, H, C, имя, значение)

[pVal,F,DF1,DF2] = coefTest (___)

Описание

пример

pVal = coefTest(glme) возвращает значение p F-теста нулевой гипотезы о том, что все коэффициенты с фиксированными эффектами обобщенной линейной модели с смешанными эффектами glme, за исключением перехвата, равны 0.

пример

pVal = coefTest(glme,H) возвращает значение p F-теста с использованием заданной контрастной матрицы, H. Нулевая гипотеза _H0: Hβ = 0, где β - вектор с фиксированными эффектами.

pVal = coefTest(glme,H,C) возвращает значение p для F-теста с использованием гипотетического значения, C. Нулевая гипотеза _H0: Hβ = C, где β - вектор с фиксированными эффектами.

pVal = coefTest(glme,H,C,Name,Value) возвращает значение p для F-теста для коэффициентов фиксированных и/или случайных эффектов обобщенной линейной модели смешанных эффектов glme, с дополнительными параметрами, заданными одним или несколькими аргументами пары имя-значение. Например, можно задать метод вычисления приближенных степеней свободы знаменателя для F-теста.

пример

[pVal,F,DF1,DF2] = coefTest(___) также возвращает F-статистику, Fи степени свободы числителя и знаменателя для F, соответственно DF1 и DF2, используя любой из предыдущих синтаксисов.

Входные аргументы

развернуть все

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

`H` - Контрасты с фиксированными эффектами
Матрица m-by-p

Контрасты с фиксированными эффектами, определенные как матрица m-by-p, где p - количество коэффициентов с фиксированными эффектами в glme. Каждая строка H представляет один контраст. Столбцы H (слева направо) соответствуют строкам вектора фиксированных эффектов p-by-1 beta (сверху вниз), чья оценка возвращается fixedEffects способ.

Типы данных: single | double

`C` - Гипотетическое значение
вектор m-by-1

Гипотетическое значение для проверки нулевой гипотезы Hβ = C, указанное как вектор m-by-1. Здесь β является вектором фиксированных эффектов, оценка которых возвращается fixedEffects.

Типы данных: single | double

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

`'DFMethod'` - Метод вычисления приблизительных степеней свободы
`'residual'` (по умолчанию) | `'none'`

Метод вычисления приблизительных степеней свободы, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

Стоимость	Описание
`'residual'`	Значение степеней свободы принимается постоянным и равным n - p, где n - число наблюдений, а p - число фиксированных эффектов.
`'none'`	Степени свободы устанавливаются на бесконечность.

Пример: 'DFMethod','none'

`'REContrast'` - Контрасты случайных эффектов
матрица m-by-q

Контрасты случайных эффектов, определяемые как пара, разделенная запятыми, состоящая из 'REContrast' и матрицу m-на-q, где q - число параметров случайных эффектов в glme. Столбцы матрицы (слева направо) соответствуют строкам вектора случайных эффектов q-by-1 B (сверху вниз), чья оценка возвращается randomEffects способ.

Типы данных: single | double

Выходные аргументы

развернуть все

`pVal` - p-значение
скалярное значение

p-значение для F-теста по коэффициентам фиксированных и/или случайных эффектов обобщенной линейной модели смешанных эффектов glme, возвращается как скалярное значение.

При подгонке модели GLME с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'), coefTest использует аппроксимацию условной среднеквадратичной ошибки прогнозирования (CMSEP) оцененной линейной комбинации фиксированных и случайных эффектов для вычисления p-значений. Это объясняет неопределенность в оценках фиксированных эффектов, но не неопределенность в оценках ковариационных параметров. Только для тестов с фиксированными эффектами, если указан 'CovarianceMethod' аргумент пары имя-значение в fitglme как 'JointHessian', то coefTest учитывает неопределенность в оценке параметров ковариации.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), coefTest основывает вывод на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

`F` - F-статистика
скалярное значение

F-статистика, возвращаемая как скалярное значение.

`DF1` - Числительные степени свободы для `F`
скалярное значение

Числительные степени свободы для F-статистики F, возвращается как скалярное значение.

Если проверить нулевую гипотезу _H0: Hβ = 0 или _H0: Hβ = C, то DF1 равно числу линейно независимых строк в H.
Если проверить нулевую гипотезу _H0: Hβ + KB = C, то DF1 равно числу линейно независимых строк в [H,K].

`DF2` - Степени свободы знаменателя для `F`
скалярное значение

Степени свободы знаменателя для F-статистики F, возвращается как скалярное значение. Значение DF2 зависит от опции, указанной 'DFMethod' аргумент пары имя-значение.

Примеры

развернуть все

Проверка значимости коэффициентов

Открыть сценарий в реальном времени

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

Флаг, указывающий, использовала ли партия новый процесс (newprocess)
Время обработки для каждой партии, в часах (time)
Температура партии, в градусах Цельсия (temp)
Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

$_{} defectsij∼Poisson (_{} мкидж$ )

Это соответствует обобщенной линейной модели смешанных эффектов

$\log (_{} micij)_{=}_{β0} +_{}_{} {β1newprocessij +}_{} β2time_{_} {devij +}_{}_{} {β3temp _devij}_{+}_{} {β4supplier_}_{} {Cij}_{} +$ β5supplier _ Bij + bi,

где

$_{defectsij}$ - количество дефектов, наблюдаемых в партии, произведенной заводом $i$ во время партии $j$ .
$_{pciij}$ - среднее число дефектов, соответствующих заводу $i$ (где $i = 1,2, . . .,$ 20) во время партии j ( $где j = 1,2,$ .. ., 5).
$_{newprocessij}$ , $_{time_devij}$ и $_{temp_devij}$ являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j $.$ Например, ${newprocessij}_{}$ указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.
$_{supplier_Cij}$ и $_{supplier_Bij}$ являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом $i$ во время партии $j$ .
$_{} bi∼N (0,_{}^{}$ startb2) - перехват случайных эффектов для каждой $фабрики$ i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Проверка наличия существенных различий между поставщиком C и поставщиком B.

H = [0,0,0,0,1,-1];

[pVal,F,DF1,DF2] = coefTest(glme,H)

pVal = 0.2793

F = 1.1842

DF1 = 1

DF2 = 94

Большое значение p указывает на отсутствие существенной разницы между поставщиком C и поставщиком B на уровне значимости 5%. Здесь, coefTest также возвращает F-статистику, числительные степени свободы и приближенные знаменательные степени свободы.

Проверка наличия существенных различий между поставщиком A и поставщиком B.

При указании 'DummyVarCoding' аргумент пары имя-значение как 'effects' при подгонке модели с использованием fitglme, то

$_{βA} +_{} {βB}_{} +$ βC = 0,

где $_{βA}$ , $_{βB}$ и $_{βC}$ соответствуют поставщикам A, B и C соответственно. $_{βA}$ - эффект А минус средний эффект А, В и С. Для определения контрастной матрицы, соответствующей тесту между поставщиком А и поставщиком В,

$_{}_{βB-βA} =_{} βB -_{(} -_{} βB-βC)_{} =_{}$ 2βB + βC.

Из выходных данных disp(glme)столбец 5 контрастной матрицы соответствует $_{βC}$ , а столбец 6 соответствует $_{βB}$ . Поэтому контрастная матрица для этого теста указана как H = [0,0,0,0,1,2].

H = [0,0,0,0,1,2];

[pVal,F,DF1,DF2] = coefTest(glme,H)

pVal = 0.6177

F = 0.2508

DF1 = 1

DF2 = 94

Большое значение p указывает на отсутствие существенной разницы между поставщиком A и поставщиком B на уровне значимости 5%.

Ссылки

[1] Бут, Дж.Г. и Дж.П. Хоберт. «Стандартные ошибки прогнозирования в обобщенных линейных смешанных моделях». Журнал Американской статистической ассоциации, том 93, 1998, стр. 262-272.

См. также

Документация

coefTest

Синтаксис

Описание

Входные аргументы

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

`H` - Контрасты с фиксированными эффектами
Матрица m-by-p

`C` - Гипотетическое значение
вектор m-by-1

Аргументы пары «имя-значение»

`'DFMethod'` - Метод вычисления приблизительных степеней свободы
`'residual'` (по умолчанию) | `'none'`

`'REContrast'` - Контрасты случайных эффектов
матрица m-by-q

Выходные аргументы

`pVal` - p-значение
скалярное значение

`F` - F-статистика
скалярное значение

`DF1` - Числительные степени свободы для `F`
скалярное значение

`DF2` - Степени свободы знаменателя для `F`
скалярное значение

Примеры

Проверка значимости коэффициентов

Ссылки

См. также

Документация по инструментам для статистического и машинного обучения

Поддержка

Документация

coefTest

Синтаксис

Описание

Входные аргументы

glme - Обобщенная линейная модель смешанных эффектов GeneralizedLinearMixedModel объект

H - Контрасты с фиксированными эффектами Матрица m-by-p

C - Гипотетическое значение вектор m-by-1

Аргументы пары «имя-значение»

'DFMethod' - Метод вычисления приблизительных степеней свободы 'residual' (по умолчанию) | 'none'

'REContrast' - Контрасты случайных эффектов матрица m-by-q

Выходные аргументы

pVal - p-значение скалярное значение

F - F-статистика скалярное значение

DF1 - Числительные степени свободы для F скалярное значение

DF2 - Степени свободы знаменателя для F скалярное значение

Примеры

Проверка значимости коэффициентов

Ссылки

См. также

Документация по инструментам для статистического и машинного обучения

Поддержка

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

`H` - Контрасты с фиксированными эффектами
Матрица m-by-p

`C` - Гипотетическое значение
вектор m-by-1

`'DFMethod'` - Метод вычисления приблизительных степеней свободы
`'residual'` (по умолчанию) | `'none'`

`'REContrast'` - Контрасты случайных эффектов
матрица m-by-q

`pVal` - p-значение
скалярное значение

`F` - F-статистика
скалярное значение

`DF1` - Числительные степени свободы для `F`
скалярное значение

`DF2` - Степени свободы знаменателя для `F`
скалярное значение