exponenta event banner

randomEffects

Класс: модель GeneralizedLinearDepartedModel

Оценки случайных эффектов и соответствующая статистика

Описание

B = randomEffects(glme) возвращает оценки эмпирических предикторов Байеса (EPB) случайных эффектов в обобщенной линейной модели смешанных эффектов glme зависит от оцененных параметров ковариации и наблюдаемого ответа.

пример

[B,BNames] = randomEffects(glme) также возвращает имена коэффициентов, BNames. Каждое имя соответствует коэффициенту в B.

[B,BNames,stats] = randomEffects(glme) также возвращает связанную статистику, stats, для оцененных EBP случайных эффектов в glme.

пример

[B,BNames,stats] = randomEffects(glme,Name,Value) возвращает любой из приведенных выше аргументов вывода, используя дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары. Например, можно задать уровень доверительного интервала или метод вычисления приблизительных степеней свободы.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Уровень значимости, указанный как разделенная запятыми пара, состоящая из 'Alpha' и скалярное значение в диапазоне [0,1]. Для значения α доверительный уровень равен 100 × (1 - α)%.

Например, для 99% доверительных интервалов можно указать доверительный уровень следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод вычисления приблизительных степеней свободы, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

СтоимостьОписание
'residual'Значение степеней свободы принимается постоянным и равным n - p, где n - число наблюдений, а p - число фиксированных эффектов.
'none'Степени свободы устанавливаются на бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

развернуть все

Оцененные эмпирические предикторы Байеса (EBP) для случайных эффектов в обобщенной линейной модели смешанных эффектов glme, возвращается в виде вектора столбца. EBP в B аппроксимируют модой эмпирического апостериорного распределения случайных эффектов с учетом оцененных параметров ковариации и наблюдаемого ответа.

Предположим glme имеет R группирующих переменных g1, g2,..., gR, с уровнями m1, m2,..., mR соответственно. Также предположим, что q1, q2,..., qR - длины векторов случайных эффектов, которые связаны с g1, g2,..., gR соответственно. Затем, B - вектор столбца длиной q1 * m1 + q2 * m2 +... + qR * mR.

randomEffects создает B путем объединения эмпирических байесовских предикторов векторов случайных эффектов, соответствующих каждому уровню каждой группирующей переменной, как [g1level1; g1level2; ...; g1levelm1; g2level1; g2level2; ...; g2levelm2; ...; gRlevel1; gRlevel2; ...; gRlevelmR]'.

Имена коэффициентов случайных эффектов в B, возвращено в виде таблицы.

Оцененные эмпирические предикторы Байеса (EBP) и связанная статистика для случайных эффектов в обобщенной линейной модели смешанных эффектов glme, возвращено в виде таблицы. stats имеет одну строку для каждого случайного эффекта и один столбец для каждой из следующих статистических данных.

Имя столбцаОписание
GroupГруппировка переменных, связанных со случайным эффектом
LevelУровень в пределах переменной группировки, соответствующей случайному эффекту
NameИмя коэффициента случайного эффекта
EstimateЭмпирический предиктор Байеса (EBP) случайного эффекта
SEPredКвадратный корень условной среднеквадратичной ошибки прогнозирования (CMSEP) с заданными параметрами ковариации и ответом
tStatt-статистика для теста на то, что коэффициент случайных эффектов равен 0
DFРасчетные степени свободы для t-статистики
pValuep-значение для t-статистики
LowerНижний предел 95% доверительного интервала для коэффициента случайных эффектов
UpperВерхний предел 95% доверительного интервала для коэффициента случайных эффектов

randomEffects вычисляет доверительные интервалы с использованием подхода условной среднеквадратичной ошибки прогнозирования (CMSEP), обусловленного оцененными параметрами ковариации и наблюдаемым ответом. Альтернативная интерпретация доверительных интервалов заключается в том, что они являются приблизительными байесовскими достоверными интервалами, обусловленными оцененными параметрами ковариации и наблюдаемым ответом.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), randomEffects вычисляет доверительные интервалы и связанную статистику на основе аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества .

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Вычислите и отобразите имена и оценочные значения эмпирических предикторов Байеса (EBP) для случайных эффектов.

[B,BNames] = randomEffects(glme)
B = 20×1

    0.2913
    0.1542
   -0.2633
   -0.4257
    0.5453
   -0.1069
    0.3040
   -0.1653
   -0.1458
   -0.0816
      ⋮

BNames=20×3 table
       Group       Level          Name      
    ___________    ______    _______________

    {'factory'}    {'1' }    {'(Intercept)'}
    {'factory'}    {'2' }    {'(Intercept)'}
    {'factory'}    {'3' }    {'(Intercept)'}
    {'factory'}    {'4' }    {'(Intercept)'}
    {'factory'}    {'5' }    {'(Intercept)'}
    {'factory'}    {'6' }    {'(Intercept)'}
    {'factory'}    {'7' }    {'(Intercept)'}
    {'factory'}    {'8' }    {'(Intercept)'}
    {'factory'}    {'9' }    {'(Intercept)'}
    {'factory'}    {'10'}    {'(Intercept)'}
    {'factory'}    {'11'}    {'(Intercept)'}
    {'factory'}    {'12'}    {'(Intercept)'}
    {'factory'}    {'13'}    {'(Intercept)'}
    {'factory'}    {'14'}    {'(Intercept)'}
    {'factory'}    {'15'}    {'(Intercept)'}
    {'factory'}    {'16'}    {'(Intercept)'}
      ⋮

Каждая строка B содержит оцененный EPB для коэффициента случайных эффектов, названного в соответствующей строке Bnames. Например, значение -0.2633 в строке 3 B - расчетный EPB для '(Intercept)' для уровня '3' из factory.

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)',...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Вычислите и отобразите 99% доверительные интервалы для коэффициентов случайных эффектов.

[B,BNames,stats] = randomEffects(glme,'Alpha',0.01);
stats
stats = 
    Random effect coefficients: DFMethod = 'residual', Alpha = 0.01

    Group              Level         Name                   Estimate     SEPred 
    {'factory'}        {'1' }        {'(Intercept)'}          0.29131    0.19163
    {'factory'}        {'2' }        {'(Intercept)'}          0.15423    0.19216
    {'factory'}        {'3' }        {'(Intercept)'}         -0.26325    0.21249
    {'factory'}        {'4' }        {'(Intercept)'}         -0.42568    0.21667
    {'factory'}        {'5' }        {'(Intercept)'}           0.5453    0.17963
    {'factory'}        {'6' }        {'(Intercept)'}         -0.10692    0.20133
    {'factory'}        {'7' }        {'(Intercept)'}          0.30404    0.18397
    {'factory'}        {'8' }        {'(Intercept)'}         -0.16527    0.20505
    {'factory'}        {'9' }        {'(Intercept)'}         -0.14577      0.203
    {'factory'}        {'10'}        {'(Intercept)'}        -0.081632    0.20256
    {'factory'}        {'11'}        {'(Intercept)'}         0.014529    0.21421
    {'factory'}        {'12'}        {'(Intercept)'}          0.17706    0.20721
    {'factory'}        {'13'}        {'(Intercept)'}          0.24872    0.20522
    {'factory'}        {'14'}        {'(Intercept)'}          0.21145    0.20678
    {'factory'}        {'15'}        {'(Intercept)'}           0.2777    0.20345
    {'factory'}        {'16'}        {'(Intercept)'}         -0.25175    0.22568
    {'factory'}        {'17'}        {'(Intercept)'}         -0.13507    0.22301
    {'factory'}        {'18'}        {'(Intercept)'}          -0.1627    0.22269
    {'factory'}        {'19'}        {'(Intercept)'}         -0.32083    0.23294
    {'factory'}        {'20'}        {'(Intercept)'}         0.058418    0.21481


    tStat       DF    pValue       Lower       Upper  
      1.5202    94      0.13182    -0.21251    0.79514
     0.80259    94      0.42423      -0.351    0.65946
     -1.2389    94      0.21846    -0.82191    0.29541
     -1.9646    94     0.052408    -0.99534    0.14398
      3.0356    94    0.0031051    0.073019     1.0176
    -0.53105    94      0.59664    -0.63625    0.42241
      1.6527    94      0.10173    -0.17964    0.78771
    -0.80597    94      0.42229    -0.70438    0.37385
    -0.71806    94       0.4745    -0.67949    0.38795
      -0.403    94      0.68786    -0.61419    0.45093
    0.067826    94      0.94607    -0.54866    0.57772
     0.85446    94      0.39502    -0.36774    0.72185
       1.212    94      0.22857    -0.29083    0.78827
      1.0226    94      0.30913    -0.33221    0.75511
       1.365    94      0.17552    -0.25719    0.81259
     -1.1156    94      0.26746    -0.84509    0.34158
    -0.60568    94      0.54619     -0.7214    0.45125
    -0.73061    94      0.46684    -0.74817    0.42278
     -1.3773    94      0.17168    -0.93325    0.29159
     0.27195    94      0.78626    -0.50635    0.62319

Первые три столбца stats содержат имя группы, уровень и имя коэффициента случайных эффектов. Столбец 4 содержит оценочную EBP коэффициента случайных эффектов. Последние два столбца stats, Lower и Upper, содержат нижнюю и верхнюю границы 99% доверительного интервала соответственно. Например, для коэффициента для '(Intercept)' для уровня 3 из factoryрасчетный EBP составляет -0,26325, а доверительный интервал 99% - [-0,82191,29541].

Ссылки

[1] Бут, Дж.Г. и Дж.П. Хоберт. «Стандартные ошибки прогнозирования в обобщенных линейных смешанных моделях». Журнал Американской статистической ассоциации, том 93, 1998, стр. 262-272.