coefCI

Класс: GeneralizedLinearMixedModel

Доверительные интервалы для коэффициентов обобщенной линейной модели смешанных эффектов

Описание

пример

feCI = coefCI(glme) возвращает 95% доверительных интервалов для коэффициентов фиксированных эффектов в обобщенной линейной модели glme смешанных эффектов.

пример

feCI = coefCI(glme,Name,Value) возвращает доверительные интервалы с помощью дополнительных опций, заданных одним или несколькими Name,Value парные аргументы. Например, можно задать различный доверительный уровень, или метод использовался для расчета аппроксимированных степеней свободы.

пример

[feCI,reCI] = coefCI(___) также возвращает доверительные интервалы для коэффициентов случайных эффектов с помощью любого из предыдущих синтаксисов.

Входные параметры

развернуть все

Обобщенная линейная модель смешанных эффектов в виде GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта, смотрите GeneralizedLinearMixedModel.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Уровень значения в виде разделенной запятой пары, состоящей из 'Alpha' и скалярное значение в области значений [0,1]. Для значения α, доверительный уровень является 100 × (1 – α) %.

Например, для 99% доверительных интервалов, можно задать доверительный уровень можно следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод для вычисления аппроксимированных степеней свободы в виде разделенной запятой пары, состоящей из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Значение степеней свободы принято постоянным и равно np, где n является количеством наблюдений, и p является количеством фиксированных эффектов.
'none'Степени свободы установлены в бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

развернуть все

Доверительные интервалы фиксированных эффектов, возвращенные как p-by-2 матрица. feCI содержит пределы достоверности, которые соответствуют p-by-1 вектор фиксированных эффектов, возвращенный fixedEffects метод. Первый столбец feCI содержит более низкие пределы достоверности, и второй столбец содержит верхние пределы достоверности.

Подбирая модель GLME с помощью fitglme и одно из наибольшего правдоподобия соответствует методам ('Laplace' или 'ApproximateLaplace'):

  • Если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'conditional', затем доверительные интервалы являются условным выражением на предполагаемых параметрах ковариации.

  • Если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'JointHessian', затем доверительные интервалы составляют неопределенность в предполагаемых параметрах ковариации.

Подбирая модель GLME с помощью fitglme и одна из псевдо вероятности соответствует методам ('MPL' или 'REMPL'), coefci использует подбиравшую линейную смешанную модель эффектов от итоговой псевдо итерации вероятности, чтобы вычислить доверительные интервалы на фиксированных эффектах.

Доверительные интервалы случайных эффектов, возвращенные как q-by-2 матрица. reCI содержит пределы достоверности, соответствующие q-by-1 вектор случайных эффектов B возвращенный randomEffects метод. Первый столбец reCI содержит более низкие пределы достоверности, и второй столбец содержит верхние пределы достоверности.

Подбирая модель GLME с помощью fitglme и одно из наибольшего правдоподобия соответствует методам ('Laplace' или 'ApproximateLaplace'), coefCI вычисляет доверительные интервалы с помощью условной среднеквадратической ошибки предсказания условное выражение подхода (CMSEP) на предполагаемых параметрах ковариации и наблюдаемом ответе. В качестве альтернативы можно интерпретировать доверительные интервалы от coefCI как аппроксимируют Байесово вероятное условное выражение интервалов на предполагаемых параметрах ковариации и наблюдаемом ответе.

Подбирая модель GLME с помощью fitglme и одна из псевдо вероятности соответствует методам ('MPL' или 'REMPL'), coefci использует подбиравшую линейную смешанную модель эффектов от итоговой псевдо итерации вероятности, чтобы вычислить доверительные интервалы на случайных эффектах.

Примеры

развернуть все

Загрузите выборочные данные.

load mfr

Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:

  • Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждого пакета, в часах (time)

  • Температура пакета, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (AB, или C) из химиката, используемого в пакете (supplier)

  • Количество дефектов в пакете (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.

Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включайте термин случайных эффектов для прерывания, сгруппированного factory, составлять качественные различия, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects', таким образом, фиктивные переменные коэффициенты суммируют к 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной линейной модели смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в пакете, произведенном фабрикой i во время пакета j.

  • μij среднее количество дефектов, соответствующих фабрике i (где i=1,2,...,20) во время пакета j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij измерения для каждой переменной, которые соответствуют фабрике i во время пакета j. Например, newprocessij указывает ли пакет, произведенный фабрикой i во время пакета j используемый новый процесс.

  • supplier_Cij и supplier_Bij фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C или B, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой i во время пакета j.

  • biN(0,σb2) прерывание случайных эффектов для каждой фабрики i это составляет специфичное для фабрики изменение по качеству.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Используйте fixedEffects отобразить оценки и имена коэффициентов фиксированных эффектов в glme.

[beta,betanames] = fixedEffects(glme)
beta = 6×1

    1.4689
   -0.3677
   -0.0945
   -0.2832
   -0.0719
    0.0711

betanames=6×1 table
         Name      
    _______________

    {'(Intercept)'}
    {'newprocess' }
    {'time_dev'   }
    {'temp_dev'   }
    {'supplier_C' }
    {'supplier_B' }

Каждая строка beta содержит ориентировочную стоимость для коэффициента, названного в соответствующей строке betanames. Например, значение –0.0945 в строке 3 beta предполагаемый коэффициент для переменного предиктора time_dev.

Вычислите 95% доверительных интервалов для коэффициентов фиксированных эффектов.

feCI = coefCI(glme)
feCI = 6×2

    1.1515    1.7864
   -0.7202   -0.0151
   -1.7395    1.5505
   -2.1926    1.6263
   -0.2268    0.0831
   -0.0826    0.2247

Столбец 1 feCI содержит нижнюю границу 95%-го доверительного интервала. Столбец 2 содержит верхнюю границу. Строка 1 соответствует термину прерывания. Строки 2, 3, и 4 соответствуют newprocess, time_dev, и temp_dev, соответственно. Строки 5 и 6 соответствуют переменным supplier_C индикатора и supplier_B, соответственно. Например, 95%-й доверительный интервал для коэффициента для time_dev [-1.7395, 1.5505]. Некоторые доверительные интервалы включают 0, который указывает, что те предикторы не являются значительными на 5%-м уровне значения. Получить конкретный p- значения для каждого термина фиксированных эффектов, используйте fixedEffects. Чтобы протестировать значение на целые условия, используйте anova.

Загрузите выборочные данные.

load mfr

Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:

  • Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждого пакета, в часах (time)

  • Температура пакета, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (AB, или C) из химиката, используемого в пакете (supplier)

  • Количество дефектов в пакете (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.

Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включайте прерывание случайных эффектов, сгруппированное factory, составлять качественные различия, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной линейной модели смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в пакете, произведенном фабрикой i во время пакета j.

  • μij среднее количество дефектов, соответствующих фабрике i (где i=1,2,...,20) во время пакета j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij измерения для каждой переменной, которые соответствуют фабрике i во время пакета j. Например, newprocessij указывает ли пакет, произведенный фабрикой i во время пакета j используемый новый процесс.

  • supplier_Cij и supplier_Bij фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C или B, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой i во время пакета j.

  • biN(0,σb2) прерывание случайных эффектов для каждой фабрики i это составляет специфичное для фабрики изменение по качеству.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Используйте randomEffects вычислить и отобразить оценки эмпирических предикторов Бейеса (EBPs) для случайных эффектов, сопоставленных с factory.

[B,Bnames] = randomEffects(glme)
B = 20×1

    0.2913
    0.1542
   -0.2633
   -0.4257
    0.5453
   -0.1069
    0.3040
   -0.1653
   -0.1458
   -0.0816
      ⋮

Bnames=20×3 table
       Group       Level          Name      
    ___________    ______    _______________

    {'factory'}    {'1' }    {'(Intercept)'}
    {'factory'}    {'2' }    {'(Intercept)'}
    {'factory'}    {'3' }    {'(Intercept)'}
    {'factory'}    {'4' }    {'(Intercept)'}
    {'factory'}    {'5' }    {'(Intercept)'}
    {'factory'}    {'6' }    {'(Intercept)'}
    {'factory'}    {'7' }    {'(Intercept)'}
    {'factory'}    {'8' }    {'(Intercept)'}
    {'factory'}    {'9' }    {'(Intercept)'}
    {'factory'}    {'10'}    {'(Intercept)'}
    {'factory'}    {'11'}    {'(Intercept)'}
    {'factory'}    {'12'}    {'(Intercept)'}
    {'factory'}    {'13'}    {'(Intercept)'}
    {'factory'}    {'14'}    {'(Intercept)'}
    {'factory'}    {'15'}    {'(Intercept)'}
    {'factory'}    {'16'}    {'(Intercept)'}
      ⋮

Каждая строка B содержит предполагаемый EBPs для коэффициента случайных эффектов, названного в соответствующей строке Bnames. Например, значение-0.2633 в строке 3 B предполагаемый коэффициент '(Intercept)' для уровня '3' из factory.

Вычислите 99% доверительных интервалов EBPs для случайных эффектов.

[feCI,reCI] = coefCI(glme,'Alpha',0.01);
reCI
reCI = 20×2

   -0.2125    0.7951
   -0.3510    0.6595
   -0.8219    0.2954
   -0.9953    0.1440
    0.0730    1.0176
   -0.6362    0.4224
   -0.1796    0.7877
   -0.7044    0.3738
   -0.6795    0.3880
   -0.6142    0.4509
      ⋮

Столбец 1 reCI содержит нижнюю границу 99%-го доверительного интервала. Столбец 2 содержит верхнюю границу. Каждая строка соответствует уровню factory, в порядке, показанном в Bnames. Например, строка 3 соответствует коэффициенту '(Intercept)' для уровня '3' из factory, который имеет 99%-й доверительный интервал [-0.8219, 0.2954]. Для дополнительной статистики, связанной с каждым термином случайных эффектов, используйте randomEffects.

Ссылки

[1] Стенд, J.G., и Дж.П. Хоберт. “Стандартные погрешности Предсказания в Обобщенных линейных Смешанных Моделях”. Журнал американской Статистической Ассоциации. Издание 93, 1998, стр 262–272.

Для просмотра документации необходимо авторизоваться на сайте