coefTest

Класс: GeneralizedLinearMixedModel

Тест гипотезы на фиксированных и случайных эффектах обобщенной линейной модели смешанных эффектов

Описание

пример

pVal = coefTest(glme) возвращает p - значение F - тест нулевой гипотезы что все коэффициенты фиксированных эффектов обобщенной линейной модели glme смешанных эффектов, за исключением точки пересечения, равны 0.

пример

pVal = coefTest(glme,H) возвращает p - значение F - тест с помощью заданной контрастной матрицы, H. Нулевая гипотеза является H0: H β = 0, где β является вектором фиксированных эффектов.

pVal = coefTest(glme,H,C) возвращает p - значение для F - тест с помощью предполагавшегося значения, C. Нулевая гипотеза является H0: H β = C, где β является вектором фиксированных эффектов.

pVal = coefTest(glme,H,C,Name,Value) возвращает p - значение для F - тестирует на фиксированном - и/или коэффициенты случайных эффектов обобщенной линейной модели glme смешанных эффектов, с дополнительными опциями, заданными одним или несколькими аргументами пары "имя-значение". Например, можно задать метод, чтобы вычислить аппроксимированные степени свободы знаменателя для F - тест.

пример

[pVal,F,DF1,DF2] = coefTest(___) также возвращает F - статистическая величина, F, и числитель и степени свободы знаменателя для F, соответственно DF1 и DF2, использование любого из предыдущих синтаксисов.

Входные параметры

развернуть все

Обобщенная линейная модель смешанных эффектов в виде GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта, смотрите GeneralizedLinearMixedModel.

Фиксированные эффекты контрастируют в виде m-by-p матрицу, где p является количеством коэффициентов фиксированных эффектов в glme. Каждая строка H представляет один контраст. Столбцы H (слева направо) соответствуйте строкам p-by-1 вектор фиксированных эффектов beta (от начала до конца), чья оценка возвращена fixedEffects метод.

Типы данных: single | double

Предполагавшееся значение для тестирования нулевой гипотезы H β = C в виде m-by-1 вектор. Здесь, β является вектором из фиксированных эффектов, оценка которых возвращена fixedEffects.

Типы данных: single | double

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Метод для вычисления аппроксимированных степеней свободы в виде разделенной запятой пары, состоящей из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Значение степеней свободы принято постоянным и равно np, где n является количеством наблюдений, и p является количеством фиксированных эффектов.
'none'Степени свободы установлены в бесконечность.

Пример: 'DFMethod','none'

Случайные эффекты контрастируют в виде разделенной запятой пары, состоящей из 'REContrast' и m-by-q матрица, где q является количеством случайных параметров эффектов в glme. Столбцы матрицы (слева направо) соответствуют строкам q-by-1 вектор случайных эффектов B (от начала до конца), чья оценка возвращена randomEffects метод.

Типы данных: single | double

Выходные аргументы

развернуть все

p - значение для F - тестирует на фиксированном - и/или коэффициенты случайных эффектов обобщенной линейной модели glme смешанных эффектов, возвращенный как скалярное значение.

При подборе кривой использованию модели GLME fitglme и одно из наибольшего правдоподобия соответствует методам ('Laplace' или 'ApproximateLaplace'), coefTest использует приближение условной среднеквадратической ошибки предсказания (CMSEP) предполагаемой линейной комбинации фиксированных - и случайные эффекты вычислить p - значения. Это составляет неопределенность в оценках фиксированных эффектов, но не для неопределенности в оценках параметра ковариации. Для тестов на фиксированных эффектах только, если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" в fitglme как 'JointHessian', затем coefTest счета на неопределенность по оценке параметров ковариации.

При подборе кривой использованию модели GLME fitglme и одна из псевдо вероятности соответствует методам ('MPL' или 'REMPL'), coefTest основывает вывод на подбиравшей линейной смешанной модели эффектов от итоговой псевдо итерации вероятности.

F-, возвращенная как скалярное значение.

Степени свободы числителя для F - статистический F, возвращенный как скалярное значение.

  • Если вы тестируете нулевую гипотезу H0: H β = 0 или H0: H β = C, затем DF1 равно количеству линейно независимых строк в H.

  • Если вы тестируете нулевую гипотезу H0: H β + KB = C, затем DF1 равно количеству линейно независимых строк в [H,K].

Степени свободы знаменателя для F - статистический F, возвращенный как скалярное значение. Значение DF2 зависит от опции, заданной 'DFMethod' аргумент пары "имя-значение".

Примеры

развернуть все

Загрузите выборочные данные.

load mfr

Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:

  • Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждого пакета, в часах (time)

  • Температура пакета, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (AB, или C) из химиката, используемого в пакете (supplier)

  • Количество дефектов в пакете (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.

Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включайте точку пересечения случайных эффектов, сгруппированную factory, с учетом качественных различий, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects', таким образом, фиктивные переменные коэффициенты суммируют к 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной линейной модели смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в пакете, произведенном фабрикой i во время пакета j.

  • μij среднее количество дефектов, соответствующих фабрике i (где i=1,2,...,20) во время пакета j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij измерения для каждой переменной, которые соответствуют фабрике i во время пакета j. Например, newprocessij указывает ли пакет, произведенный фабрикой i во время пакета j используемый новый процесс.

  • supplier_Cij и supplier_Bij фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C или B, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой i во время пакета j.

  • biN(0,σb2) точка пересечения случайных эффектов для каждой фабрики i это составляет специфичное для фабрики изменение по качеству.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Протестируйте, если существует какая-либо значительная разница между поставщиком К и поставщиком Б.

H = [0,0,0,0,1,-1];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.2793
F = 1.1842
DF1 = 1
DF2 = 94

Большое p- значение указывает, что нет никакой значительной разницы между поставщиком К и поставщиком Б на 5%-м уровне значения. Здесь, coefTest также возвращается F- статистическая величина, степени свободы числителя и аппроксимированные степени свободы знаменателя.

Протестируйте, если существует какая-либо значительная разница между поставщиком А и поставщиком Б.

Если вы задаете 'DummyVarCoding' аргумент пары "имя-значение" как 'effects' подбирая модель с помощью fitglmeто

βA+βB+βC=0,

где βA, βB, и βC соответствуйте поставщикам А, Б и К, соответственно. βA эффект минус средний эффект A, B, и C. Определить контрастную матрицу, соответствующую тесту между поставщиком А и поставщиком Б,

βB-βA=βB-(-βB-βC)=2βB+βC.

От выхода disp(glme), столбец 5 контрастной матрицы соответствует βC, и столбец 6 соответствует βB. Поэтому контрастная матрица для этого теста задана как H = [0,0,0,0,1,2].

H = [0,0,0,0,1,2];

[pVal,F,DF1,DF2] = coefTest(glme,H)
pVal = 0.6177
F = 0.2508
DF1 = 1
DF2 = 94

Большое p- значение указывает, что нет никакой значительной разницы между поставщиком А и поставщиком Б на 5%-м уровне значения.

Ссылки

[1] Стенд, J.G., и Дж.П. Хоберт. “Стандартные погрешности Предсказания в Обобщенных линейных Смешанных Моделях”. Журнал американской Статистической Ассоциации, Издания 93, 1998, стр 262–272.