exponenta event banner

coefCI

Класс: модель GeneralizedLinearDepartedModel

Доверительные интервалы для коэффициентов обобщенной линейной модели смешанных эффектов

Описание

пример

feCI = coefCI(glme) возвращает 95% доверительные интервалы для коэффициентов фиксированных эффектов в обобщенной линейной модели смешанных эффектов glme.

пример

feCI = coefCI(glme,Name,Value) возвращает доверительные интервалы, используя дополнительные опции, указанные одним или несколькими Name,Value аргументы пары. Например, можно указать другой доверительный уровень или метод, используемый для вычисления приближенных степеней свободы.

пример

[feCI,reCI] = coefCI(___) также возвращает доверительные интервалы для коэффициентов случайных эффектов, используя любой из предыдущих синтаксисов.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Уровень значимости, указанный как разделенная запятыми пара, состоящая из 'Alpha' и скалярное значение в диапазоне [0,1]. Для значения α доверительный уровень равен 100 × (1 - α)%.

Например, для 99% доверительных интервалов можно указать доверительный уровень следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод вычисления приблизительных степеней свободы, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

СтоимостьОписание
'residual'Значение степеней свободы принимается постоянным и равным n - p, где n - число наблюдений, а p - число фиксированных эффектов.
'none'Степени свободы устанавливаются на бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

развернуть все

Доверительные интервалы с фиксированными эффектами, возвращаемые в виде матрицы p-by-2. feCI содержит доверительные пределы, которые соответствуют вектору фиксированных эффектов p-by-1, возвращаемому fixedEffects способ. Первый столбец feCI содержит нижние доверительные пределы, а второй столбец содержит верхние доверительные пределы.

При подгонке модели GLME с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'):

  • При указании 'CovarianceMethod' аргумент пары имя-значение как 'conditional', то доверительные интервалы зависят от оцененных параметров ковариации.

  • При указании 'CovarianceMethod' аргумент пары имя-значение как 'JointHessian', то доверительные интервалы учитывают неопределенность в оцененных параметрах ковариации.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), coefci использует аппроксимированную линейную модель смешанных эффектов из финальной псевдо-итерации правдоподобия для вычисления доверительных интервалов для фиксированных эффектов.

Доверительные интервалы случайных эффектов, возвращаемые в виде матрицы q-by-2. reCI содержит доверительные пределы, соответствующие вектору случайных эффектов q-by-1 B возвращено randomEffects способ. Первый столбец reCI содержит нижние доверительные пределы, а второй столбец содержит верхние доверительные пределы.

При подгонке модели GLME с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'), coefCI вычисляет доверительные интервалы с использованием подхода условной среднеквадратичной ошибки прогнозирования (CMSEP), обусловленного оцененными параметрами ковариации и наблюдаемым ответом. Можно также интерпретировать доверительные интервалы из coefCI как приблизительные байесовские достоверные интервалы, зависящие от оценочных параметров ковариации и наблюдаемого ответа.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), coefci использует аппроксимированную линейную модель смешанных эффектов из финальной псевдо-итерации правдоподобия для вычисления доверительных интервалов на случайных эффектах.

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Использовать fixedEffects для отображения оценок и имен коэффициентов с фиксированными эффектами в glme.

[beta,betanames] = fixedEffects(glme)
beta = 6×1

    1.4689
   -0.3677
   -0.0945
   -0.2832
   -0.0719
    0.0711

betanames=6×1 table
         Name      
    _______________

    {'(Intercept)'}
    {'newprocess' }
    {'time_dev'   }
    {'temp_dev'   }
    {'supplier_C' }
    {'supplier_B' }

Каждая строка beta содержит оценочное значение коэффициента, указанного в соответствующей строке betanames. Например, значение -0.0945 в строке 3 beta - оценочный коэффициент для переменной предиктора time_dev.

Вычислите 95% доверительные интервалы для коэффициентов с фиксированными эффектами.

feCI = coefCI(glme)
feCI = 6×2

    1.1515    1.7864
   -0.7202   -0.0151
   -1.7395    1.5505
   -2.1926    1.6263
   -0.2268    0.0831
   -0.0826    0.2247

Колонка 1 из feCI содержит нижнюю границу 95% доверительного интервала. Столбец 2 содержит верхнюю границу. Строка 1 соответствует члену перехвата. Строки 2, 3 и 4 соответствуют newprocess, time_dev, и temp_devсоответственно. Строки 5 и 6 соответствуют переменным индикатора supplier_C и supplier_Bсоответственно. Например, 95% доверительный интервал для коэффициента для time_dev равно [-1.7395, 1.5505]. Некоторые из доверительных интервалов включают 0, что указывает на то, что эти предикторы не являются значимыми на уровне значимости 5%. Чтобы получить конкретные значения p для каждого члена с фиксированными эффектами, используйте fixedEffects. Чтобы проверить значимость для всех терминов, используйте anova.

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить перехват случайных эффектов, сгруппированный по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Использовать randomEffects для вычисления и отображения оценок эмпирических предикторов Байеса (EBP) для случайных эффектов, связанных с factory.

[B,Bnames] = randomEffects(glme)
B = 20×1

    0.2913
    0.1542
   -0.2633
   -0.4257
    0.5453
   -0.1069
    0.3040
   -0.1653
   -0.1458
   -0.0816
      ⋮

Bnames=20×3 table
       Group       Level          Name      
    ___________    ______    _______________

    {'factory'}    {'1' }    {'(Intercept)'}
    {'factory'}    {'2' }    {'(Intercept)'}
    {'factory'}    {'3' }    {'(Intercept)'}
    {'factory'}    {'4' }    {'(Intercept)'}
    {'factory'}    {'5' }    {'(Intercept)'}
    {'factory'}    {'6' }    {'(Intercept)'}
    {'factory'}    {'7' }    {'(Intercept)'}
    {'factory'}    {'8' }    {'(Intercept)'}
    {'factory'}    {'9' }    {'(Intercept)'}
    {'factory'}    {'10'}    {'(Intercept)'}
    {'factory'}    {'11'}    {'(Intercept)'}
    {'factory'}    {'12'}    {'(Intercept)'}
    {'factory'}    {'13'}    {'(Intercept)'}
    {'factory'}    {'14'}    {'(Intercept)'}
    {'factory'}    {'15'}    {'(Intercept)'}
    {'factory'}    {'16'}    {'(Intercept)'}
      ⋮

Каждая строка B содержит оцененные EBP для коэффициента случайных эффектов, названного в соответствующей строке Bnames. Например, значение -0.2633 в строке 3 B - расчетный коэффициент '(Intercept)' для уровня '3' из factory.

Вычислите 99% доверительные интервалы EBP для случайных эффектов.

[feCI,reCI] = coefCI(glme,'Alpha',0.01);
reCI
reCI = 20×2

   -0.2125    0.7951
   -0.3510    0.6595
   -0.8219    0.2954
   -0.9953    0.1440
    0.0730    1.0176
   -0.6362    0.4224
   -0.1796    0.7877
   -0.7044    0.3738
   -0.6795    0.3880
   -0.6142    0.4509
      ⋮

Колонка 1 из reCI содержит нижнюю границу 99% доверительного интервала. Столбец 2 содержит верхнюю границу. Каждая строка соответствует уровню factory, в порядке, показанном на Bnames. Например, строка 3 соответствует коэффициенту '(Intercept)' для уровня '3' из factory, который имеет 99% доверительный интервал [-0,8219, 0,2954]. Для дополнительной статистики, связанной с каждым термином случайных эффектов, используйте randomEffects.

Ссылки

[1] Бут, Дж.Г. и Дж.П. Хоберт. «Стандартные ошибки прогнозирования в обобщенных линейных смешанных моделях». Журнал Американской статистической ассоциации. Том 93, 1998, стр. 262-272.