Линейные модели смешанных эффектов

Линейные модели смешанных эффектов являются расширениями линейных регрессионых моделей для данных, которые собираются и суммируются в группах. Эти модели описывают связь между переменной отклика и независимыми переменными с коэффициентами, которые могут варьироваться относительно одной или нескольких сгруппированных переменных. Модель смешанных эффектов состоит из двух частей, фиксированных эффектов и случайных эффектов. Члены с фиксированными эффектами обычно являются обычной линейной регрессионой частью, и случайные эффекты связаны с отдельными экспериментальными модулями, нарисованными случайным образом из населения. Модели смешанных эффектов могут представлять ковариационную структуру, связанную с группировкой данных, путем связи общих случайных эффектов с наблюдениями, которые имеют тот же уровень переменной группировки. Стандартная форма линейной модели смешанных эффектов

y=Xβfixed+Zbrandom+εerror,

где

  • y - n вектор отклика -by-1, а n - количество наблюдений.

  • X является n матрицей проекта -by p fixed-effects.

  • β является вектором p -by-1 с фиксированными эффектами.

  • Z является n матрицей проекта -by q random-эффектов.

  • b является q вектором случайных эффектов -by-1.

  • ε является n вектором ошибки наблюдения -by-1.

Допущения для модели линейных смешанных эффектов:

  • Вектор, b и вектор ошибок случайных эффектов, ε, имеют следующие предшествующие распределения:

    b~N(0,σ2D(θ)),ε~N(0,σI2),

    где D - симметричная и положительная полуопределенная матрица, параметризованная вектором θ дисперсионного компонента, I является единичной матрицей n -by n и σ2 - отклонение ошибок.

  • Вектор, b и вектор ошибок случайных эффектов, ε, независимы друг от друга.

Модели со смешанными эффектами также называются многоуровневыми моделями или иерархическими моделями в зависимости от контекста. Модели со смешанными эффектами являются более общим термином, чем последние две. Модели со смешанными эффектами могут включать факторы, которые не обязательно являются многоуровневыми или иерархическими, например перекрестные факторы. Именно поэтому здесь предпочтительной терминологией являются смешанные эффекты. Иногда модели со смешанными эффектами выражаются как многоуровневые регрессионые модели (модели первого уровня и модели уровня группировки), которые подгоняются одновременно. Для примера изменяющаяся или случайная точка пересечения модель с одной непрерывной переменной предиктора x и одной сгруппированной переменной с M уровнями, может быть выражена как

yim=β0m+β1xim+εim,i=1,2,..,n,m=1,2,...,M,εim~N(0,σ2),β0m=β00+b0m,b0m~N(0,σ02),

где <reservedrangesplaceholder6> <reservedrangesplaceholder5> соответствует данным для наблюдения i, и группа <reservedrangesplaceholder3>, <reservedrangesplaceholder2> - общее количество наблюдений, и b0 <reservedrangesplaceholder1> и ε <reservedrangesplaceholder0> независимы друг от друга. После подстановки параметров уровня группы в модели первого уровня модель для вектора отклика становится

yim=β00+β1ximfixedeffects+b0mrandomeffects+εim.

Модель случайной точки пересечения и наклона с одной непрерывной переменной предиктора x, где и точка пересечения, и наклон изменяются независимо от сгруппированной переменной с M уровнями,

yim=β0m+β1mxim+εim,i=1,2,...,n,m=1,2,...,M,εim~N(0,σ2),β0m=β00+b0m,b0m~N(0,σ02),β1m=β10+b1m,b1m~N(0,σ12),

или

bm=(b0mb1m)~N(0,(σ0200σ12)).

Вы также можете иметь коррелированные случайные эффекты. В целом для модели со случайной точкой пересечения и наклоном, распределение случайных эффектов является

bm=(b0mb1m)~N(0,σD2(θ)),

где D - симметричная и положительная полуопределенная матрица 2 на 2, параметризованная вектором с дисперсионной составляющей θ.

После подстановки параметров уровня группы в модели первого уровня модель для вектора отклика является

yim=β00+β10ximfixedeffects+b0m+b1mximrandomeffects+εim,i=1,2,...,n,m=1,2,...,M.

Если вы выражаете переменную уровня группы, x im, в термине случайных эффектов по z im, эта модель является

yim=β00+β10ximfixedeffects+b0m+b1mzimrandomeffects+εim,i=1,2,...,n,m=1,2,...,M.

В этом случае одни и те же условия появляются как в матрице проекта с фиксированными эффектами, так и в матрице проекта со случайными эффектами. Каждый zim и xim соответствуют m уровня сгруппированной переменной.

Можно также объяснить больше изменения уровня группы, добавив больше переменных предиктора уровня группы. Модель случайного перехвата и случайного наклона с одним непрерывным x переменной предиктора, где и перехват, и наклон изменяются независимо от переменной группировки с M уровнями, и одна переменная предиктора группового уровня v m

yim=β0im+β1imxim+εim,i=1,2,...,n,m=1,2,...,M,εim~N(0,σ2),β0im=β00+β01vim+b0m,b0m~N(0,σ02),β1im=β10+β11vim+b1m,b1m~N(0,σ12).

Эта модель приводит к основным эффектам предиктора уровня группы и термину взаимодействия между переменными предиктора первого уровня и уровня группы в модели для переменной отклика как

yim=β00+β01vim+b0m+(β10+β11vim+b1m)xim+εim,i=1,2,...,n,m=1,2,...,M,=β00+β10xim+β01vim+β11vimximfixedeffects+b0m+b1mximrandomeffects+εim.

Термин <reservedrangesplaceholder5>11<reservedrangesplaceholder4><reservedrangesplaceholder3><reservedrangesplaceholder2><reservedrangesplaceholder1> часто называют взаимодействием поперечного уровня во многих учебниках по многоуровневым моделям. Модель для y переменной отклика может быть выражена как

yim=[1x1imvimvimx1im][β00β10β01β11]+[1x1im][b0mb1m]+εim,i=1,2,...,n,m=1,2,...,M,

который соответствует стандартной форме, заданной ранее,

y=Xβ+Zb+ε.

В целом, если существует R переменных группирования, и m (r, i) показывает уровень группирования переменных r, для i наблюдений, то модель для переменной отклика для i наблюдений

yi=xiTβ+r=1Rzirbm(r,i)(r)+εi,i=1,2,...,n,

где β - вектор p -by-1 с фиксированными эффектами, b(r)m (r, i) q (<reservedrangesplaceholder7>)-by-1 вектор случайных эффектов для сгруппированной переменной <reservedrangesplaceholder6> th и уровня <reservedrangesplaceholder5> (r, i), и <reservedrangesplaceholder2> <reservedrangesplaceholder1> - остаточный член 1 на 1 для наблюдения i.

Ссылки

[1] Pinherio, J. C., and D. M. Bates. Модели смешанных эффектов в S и S-PLUS. Statistics and Computing Series, Springer, 2004.

[2] Харихаран, С. и Дж. Х. Роджерс. «Процедуры оценки для иерархических линейных моделей». Многоуровневое моделирование образовательных данных (A. A. Connell and D. B. McCoach, eds.). Шарлотта, NC: Information Age Publishing, Inc., 2008.

[3] Hox, J. Многоуровневый анализ, методы и приложения. Lawrence Erlbaum Associates, Inc., 2002

[4] Snidjers, T. and R. Bosker. Многоуровневый анализ. Тысяча дубов, CA: Sage Publications, 1999.

[5] Гельман, А. и Дж. Хилл. Анализ данных с использованием регрессии и многоуровневых/иерархических моделей. Нью-Йорк, Нью-Йорк: Cambridge University Press, 2007.

См. также

| |

Похожие темы