coefCI

Класс: GeneralizedLinearMixedModel

Доверительные интервалы для коэффициентов обобщенной линейной модели смешанных эффектов

Описание

пример

feCI = coefCI(glme) возвращает 95% доверительные интервалы для коэффициентов с фиксированными эффектами в обобщенной модели линейных смешанных эффектов glme.

пример

feCI = coefCI(glme,Name,Value) возвращает доверительные интервалы, используя дополнительные опции, заданные одним или несколькими Name,Value аргументы в виде пар. Для примера можно задать другой уровень доверия или метод, используемый для вычисления приблизительных степеней свободы.

пример

[feCI,reCI] = coefCI(___) также возвращает доверительные интервалы для коэффициентов случайных эффектов, используя любой из предыдущих синтаксисов.

Входные параметры

расширить все

Обобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Уровень значимости, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений [0,1]. Для значения α доверительный уровень равен 100 × (1 - α)%.

Для примера для 99% интервалов доверия можно задать уровень доверия следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод для вычисления приблизительных степеней свободы, заданный как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Степени свободы значения приняты постоянными и равными n - p, где n - количество наблюдений и p - количество фиксированных эффектов.
'none'Степени свободы заданы как бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

расширить все

Доверительные интервалы с фиксированными эффектами, возвращенные как p-на-2 матрица. feCI содержит доверительные пределы, которые соответствуют вектору p -by-1 с фиксированными эффектами, возвращаемым fixedEffects способ. Первый столбец feCI содержит нижние доверительные пределы, а второй столбец содержит верхние доверительные пределы.

При подборе модели GLME используя fitglme и один из максимальных методов подгонки правдоподобия ('Laplace' или 'ApproximateLaplace'):

  • Если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'conditional', тогда доверительные интервалы обусловлены оцененными ковариационными параметрами.

  • Если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'JointHessian'тогда доверительные интервалы учитывают неопределенность в оцененных ковариационных параметрах.

При подборе модели GLME используя fitglme и один из методов подгонки псевдоправдоподобия ('MPL' или 'REMPL'), coefci использует подобранную модель линейных смешанных эффектов из окончательной итерации псевдовидения, чтобы вычислить доверительные интервалы на фиксированных эффектах.

Доверительные интервалы случайных эффектов, возвращенные как q-на-2 матрица. reCI содержит доверительные пределы, соответствующие вектору случайных эффектов q -by-1 B возвращен randomEffects способ. Первый столбец reCI содержит нижние доверительные пределы, а второй столбец содержит верхние доверительные пределы.

При подборе модели GLME используя fitglme и один из максимальных методов подгонки правдоподобия ('Laplace' или 'ApproximateLaplace'), coefCI вычисляет доверительные интервалы с использованием подхода условной средней квадратичной невязки предсказания (CMSEP), обусловленного предполагаемыми ковариационными параметрами и наблюдаемым ответом. Также можно интерпретировать доверительные интервалы из coefCI как приблизительные байесовские достоверные интервалы, обусловленные предполагаемыми ковариационными параметрами и наблюдаемой реакцией.

При подборе модели GLME используя fitglme и один из методов подгонки псевдоправдоподобия ('MPL' или 'REMPL'), coefci использует подобранную модель линейных смешанных эффектов из окончательной итерации псевдовидения, чтобы вычислить доверительные интервалы на случайных эффектах.

Примеры

расширить все

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите термин случайных эффектов для точки пересечения, сгруппированного по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной модели линейных смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Использование fixedEffects для отображения оценок и имен коэффициентов с фиксированными эффектами в glme.

[beta,betanames] = fixedEffects(glme)
beta = 6×1

    1.4689
   -0.3677
   -0.0945
   -0.2832
   -0.0719
    0.0711

betanames=6×1 table
         Name      
    _______________

    {'(Intercept)'}
    {'newprocess' }
    {'time_dev'   }
    {'temp_dev'   }
    {'supplier_C' }
    {'supplier_B' }

Каждая строка beta содержит оценочное значение для коэффициента, названного в соответствующей строке betanames. Для примера значение -0.0945 в строке 3 beta - оцененный коэффициент для переменной предиктора time_dev.

Вычислите 95% доверительные интервалы для коэффициентов с фиксированными эффектами.

feCI = coefCI(glme)
feCI = 6×2

    1.1515    1.7864
   -0.7202   -0.0151
   -1.7395    1.5505
   -2.1926    1.6263
   -0.2268    0.0831
   -0.0826    0.2247

Столбец 1 feCI содержит нижнюю границу интервала 95% доверия. Столбец 2 содержит верхнюю границу. Строка 1 соответствует термину точки пересечения. Строки 2, 3 и 4 соответствуют newprocess, time_dev, и temp_dev, соответственно. Строки 5 и 6 соответствуют переменным индикатора supplier_C и supplier_B, соответственно. Для примера интервал 95% доверия для коэффициента для time_dev [-1.7395, 1.5505]. Некоторые из доверия интервалов включают 0, что указывает на то, что эти предикторы не значимы на уровне 5% значимости. Чтобы получить конкретный p-значения для каждого термина с фиксированными эффектами, использование fixedEffects. Чтобы проверить значимость для целых терминов, используйте anova.

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите точку пересечения случайных эффектов, сгруппированный по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной модели линейных смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Использование randomEffects вычислить и отобразить оценки эмпирических предикторов Байеса (EBP) для случайных эффектов, связанных с factory.

[B,Bnames] = randomEffects(glme)
B = 20×1

    0.2913
    0.1542
   -0.2633
   -0.4257
    0.5453
   -0.1069
    0.3040
   -0.1653
   -0.1458
   -0.0816
      ⋮

Bnames=20×3 table
       Group       Level          Name      
    ___________    ______    _______________

    {'factory'}    {'1' }    {'(Intercept)'}
    {'factory'}    {'2' }    {'(Intercept)'}
    {'factory'}    {'3' }    {'(Intercept)'}
    {'factory'}    {'4' }    {'(Intercept)'}
    {'factory'}    {'5' }    {'(Intercept)'}
    {'factory'}    {'6' }    {'(Intercept)'}
    {'factory'}    {'7' }    {'(Intercept)'}
    {'factory'}    {'8' }    {'(Intercept)'}
    {'factory'}    {'9' }    {'(Intercept)'}
    {'factory'}    {'10'}    {'(Intercept)'}
    {'factory'}    {'11'}    {'(Intercept)'}
    {'factory'}    {'12'}    {'(Intercept)'}
    {'factory'}    {'13'}    {'(Intercept)'}
    {'factory'}    {'14'}    {'(Intercept)'}
    {'factory'}    {'15'}    {'(Intercept)'}
    {'factory'}    {'16'}    {'(Intercept)'}
      ⋮

Каждая строка B содержит предполагаемые EBP для коэффициента случайных эффектов, названного в соответствующей строке Bnames. Для примера значение -0.2633 в строке 3 B - предполагаемый коэффициент '(Intercept)' для '3' уровня от factory.

Вычислите 99% доверительные интервалы EBP для случайных эффектов.

[feCI,reCI] = coefCI(glme,'Alpha',0.01);
reCI
reCI = 20×2

   -0.2125    0.7951
   -0.3510    0.6595
   -0.8219    0.2954
   -0.9953    0.1440
    0.0730    1.0176
   -0.6362    0.4224
   -0.1796    0.7877
   -0.7044    0.3738
   -0.6795    0.3880
   -0.6142    0.4509
      ⋮

Столбец 1 reCI содержит нижнюю границу интервала 99% доверия. Столбец 2 содержит верхнюю границу. Каждая строка соответствует уровню factory, в порядке, показанном на Bnames. Для примера строка 3 соответствует коэффициенту '(Intercept)' для '3' уровня от factory, который имеет 99% доверительный интервал [-0,8219, 0,2954]. Для дополнительной статистики, связанной с каждым термином случайных эффектов, используйте randomEffects.

Ссылки

[1] Booth, J.G., and J.P. Хоберт. Стандартные ошибки предсказания в обобщенных линейных смешанных моделях. Журнал Американской статистической ассоциации. Том 93, 1998, стр. 262-272.