exponenta event banner

fixedEffects

Класс: модель GeneralizedLinearDepartedModel

Оценки фиксированных эффектов и смежная статистика

Описание

beta = fixedEffects(glme) возвращает оцененные коэффициенты с фиксированными эффектами, beta, обобщенной линейной модели смешанных эффектов glme.

[beta,betanames] = fixedEffects(glme) также возвращает имена оцененных коэффициентов с фиксированными эффектами в betanames. Каждое имя соответствует коэффициенту фиксированных эффектов в beta.

пример

[beta,betanames,stats] = fixedEffects(glme) также возвращает таблицу статистики, stats, связанные с оценочными коэффициентами фиксированных эффектов glme.

[___] = fixedEffects(glme,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах с помощью дополнительных параметров, заданных одним или несколькими Name,Value аргументы пары. Например, можно задать доверительный уровень или метод вычисления приблизительных степеней свободы для t-статистики.

Входные аргументы

развернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Уровень значимости, указанный как разделенная запятыми пара, состоящая из 'Alpha' и скалярное значение в диапазоне [0,1]. Для значения α доверительный уровень равен 100 × (1 - α)%.

Например, для 99% доверительных интервалов можно указать доверительный уровень следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод вычисления приблизительных степеней свободы, определяемый как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

СтоимостьОписание
'residual'Значение степеней свободы принимается постоянным и равным n - p, где n - число наблюдений, а p - число фиксированных эффектов.
'none'Степени свободы устанавливаются на бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

развернуть все

Оценочные коэффициенты с фиксированными эффектами аппроксимированной обобщенной линейной модели с смешанными эффектами glme, возвращено как вектор.

Имена коэффициентов с фиксированными эффектами в beta, возвращено в виде таблицы.

Оценки фиксированных эффектов и связанные статистические данные, возвращаемые в виде массива наборов данных, который имеет одну строку для каждого из фиксированных эффектов и один столбец для каждой из следующих статистических данных.

Имя столбцаОписание
NameНаименование коэффициента фиксированных эффектов
EstimateОценочное значение коэффициента
SEСтандартная погрешность оценки
tStatt-статистика для теста, что коэффициент равен 0
DFРасчетные степени свободы для t-статистики
pValuep-значение для t-статистики
LowerНижний предел 95% доверительного интервала для коэффициента фиксированных эффектов
UpperВерхний предел 95% доверительного интервала для коэффициента фиксированных эффектов

При подгонке модели с использованием fitglme и один из методов подгонки с максимальным правдоподобием ('Laplace' или 'ApproximateLaplace'), если вы указываете 'CovarianceMethod' аргумент пары имя-значение как 'conditional', то SE не учитывает неопределенность в оценке параметров ковариации. Чтобы учесть эту неопределенность, укажите 'CovarianceMethod' как 'JointHessian'.

При подгонке модели GLME с использованием fitglme и один из методов псевдоправдоподобия ('MPL' или 'REMPL'), fixedEffects основывает оценки фиксированных эффектов и соответствующие статистические данные на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

Примеры

развернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж)

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Вычислите и отобразите оцененные значения коэффициента с фиксированными эффектами и соответствующую статистику.

[beta,betanames,stats] = fixedEffects(glme);
stats
stats = 
    Fixed effect coefficients: DFMethod = 'residual', Alpha = 0.05

    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Возвращенные результаты указывают, например, что оценочный коэффициент для temp_dev составляет -0.28317. Его большое значение p, 0,76907, указывает на то, что он не является статистически значимым предиктором на уровне значимости 5%. Кроме того, границы доверительного интервала Lower и Upper указать, что 95% доверительный интервал для коэффициента для temp_dev является [-2.1926, 1.6263]. Этот интервал содержит 0, что подтверждает вывод о том, что temp_dev не является статистически значимым при уровне значимости 5%.