fixedEffects

Класс: GeneralizedLinearMixedModel

Оценки фиксированных эффектов и соответствующие статистические данные

Описание

beta = fixedEffects(glme) возвращает оцененные коэффициенты с фиксированными эффектами, beta, обобщенной модели линейных смешанных эффектов glme.

[beta,betanames] = fixedEffects(glme) также возвращает имена предполагаемых коэффициентов с фиксированными эффектами в betanames. Каждое имя соответствует коэффициенту с фиксированными эффектами в beta.

пример

[beta,betanames,stats] = fixedEffects(glme) также возвращает таблицу статистики, stats, относящийся к предполагаемым коэффициентам фиксированных эффектов glme.

[___] = fixedEffects(glme,Name,Value) возвращает любой из выходных аргументов в предыдущих синтаксисах с помощью дополнительных опций, заданных одним или несколькими Name,Value аргументы в виде пар. Например, можно задать доверительный уровень или метод для вычисления приблизительных степеней свободы для t-statistic.

Входные параметры

расширить все

Обобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Уровень значимости, заданный как разделенная разделенными запятой парами, состоящая из 'Alpha' и скалярное значение в области значений [0,1]. Для значения α доверительный уровень равен 100 × (1 - α)%.

Для примера для 99% интервалов доверия можно задать уровень доверия следующим образом.

Пример: 'Alpha',0.01

Типы данных: single | double

Метод для вычисления приблизительных степеней свободы, заданный как разделенная запятыми пара, состоящая из 'DFMethod' и одно из следующих.

ЗначениеОписание
'residual'Степени свободы значения приняты постоянными и равными n - p, где n - количество наблюдений и p - количество фиксированных эффектов.
'none'Степени свободы заданы как бесконечность.

Пример: 'DFMethod','none'

Выходные аргументы

расширить все

Предполагаемые коэффициенты фиксированных эффектов подобранной обобщенной линейной модели смешанных эффектов glme, возвращается как вектор.

Имена коэффициентов с фиксированными эффектами в beta, возвращается как таблица.

Оценки фиксированных эффектов и связанная статистика, возвращенные как массив набора данных, который имеет по одной строке для каждого из фиксированных эффектов и по одному столбцу для каждой из следующих статистических данных.

Имя столбцаОписание
NameИмя коэффициента фиксированных эффектов
EstimateРасчетное значение коэффициента
SEСтандартная ошибка оценки
tStatt -statistic для теста, что коэффициент равен 0
DFПредполагаемые степени свободы для t -статистического
pValuep -value для t -statistic
LowerНижний предел интервала доверия 95% для коэффициента с фиксированными эффектами
UpperВерхний предел интервала доверия 95% для коэффициента с фиксированными эффектами

При подборе модели используя fitglme и один из максимальных методов подгонки правдоподобия ('Laplace' или 'ApproximateLaplace'), если вы задаете 'CovarianceMethod' аргумент пары "имя-значение" как 'conditional', затем SE не учитывает неопределенность при оценке ковариационных параметров. Чтобы учесть эту неопределенность, задайте 'CovarianceMethod' как 'JointHessian'.

При подборе модели GLME используя fitglme и один из методов подгонки псевдоправдоподобия ('MPL' или 'REMPL'), fixedEffects основывает оценки фиксированных эффектов и связанную статистику на подобранной модели линейных смешанных эффектов от окончательной итерации псевдоправдоподобия.

Примеры

расширить все

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите термин случайных эффектов для точки пересечения, сгруппированного по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij)

Это соответствует обобщенной модели линейных смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Вычислите и отобразите предполагаемые значения коэффициентов фиксированных эффектов и связанную статистику.

[beta,betanames,stats] = fixedEffects(glme);
stats
stats = 
    Fixed effect coefficients: DFMethod = 'residual', Alpha = 0.05

    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Возвращенные результаты указывают, для примера, что предполагаемый коэффициент для temp_dev -0.28317. Его большой p-значение, 0,76907, указывает, что это не статистически значимый предиктор на уровне 5% значимости. Кроме того, контуры доверительных интервалов Lower и Upper указать, что 95% доверительный интервал для коэффициента для temp_dev является [-2.1926, 1.6263]. Этот интервал содержит 0, что поддерживает вывод, что temp_dev не является статистически значимым на уровне 5% значимости.