Подготовка данных для линейных моделей Смешанных Эффектов

Таблицы и массивы набора данных

Чтобы подбирать линейно смешанную модель эффектов, необходимо хранить данные в массиве набора данных или таблице. В вашей таблице или массиве набора данных, у вас должен быть столбец для каждой переменной включая переменную отклика. А именно, таблица или массив набора данных, говорит tbl, должен содержать следующее:

Переменная отклика y
Прогнозирующие переменные _Xjкоторый может быть непрерывным или сгруппированные переменные
Сгруппированные переменные _g1, _g2..., _gR,

где сгруппированные переменные в _Xj и _gr может быть категориальным, логическим, символьный массив, массив строк или массив ячеек из символьных векторов, r = 1, 2..., R.

Необходимо организовать данные так, чтобы каждая строка представляла наблюдение. И каждая строка должна содержать значение переменных и уровни сгруппированных переменных, соответствующих тому наблюдению. Например, если у вас есть данные из эксперимента с четырьмя вариантами лечения на пяти различных типах индивидуумов, выбранных случайным образом из населения индивидуумов (блоки), таблица или массив набора данных должны выглядеть так.

Блок	Обработка	Ответ
1	1	y11
1	2	y12
1	3	y13
1	4	y14
...	...	...
5	1	y51
5	2	y52
5	3	y53
5	4	y54

Теперь рассмотрите эксперимент графика разделения, где эффект четырех различных типов удобрений на выражении томатных объектов изучен. Почва, где томатные объекты установлены, разделена на три блока на основе типа грунта: песчаный, илистый, и глинистый. Каждый блок разделен на пять графиков, где пять типов томатных объектов, (вишня, семейная реликвия, виноград, виноградная лоза и слива) случайным образом присвоены этим графикам. Затем томатные объекты в графиках разделены на подграфики, где каждый подграфик обработан одним из этих четырех удобрений. Данные из этого эксперимента похожи:

Почва	Помидор	Удобрение	Выражение
'Песчаный'	'Слива'	1	104
'Песчаный'	'Слива'	2	136
'Песчаный'	'Слива'	3	158
'Песчаный'	'Слива'	4	174
'Песчаный'	'Cherry'	1	57
'Песчаный'	'Cherry'	2	86
...	...	...	...
'Песчаный'	'Виноградная лоза'	3	99
'Песчаный'	'Виноградная лоза'	4	117
'Илистый'	'Слива'	1	120
'Илистый'	'Слива'	2	115
...	...	...	...
'Глинистый'	'Виноградная лоза'	3	111
'Глинистый'	'Виноградная лоза'	4	105

Необходимо задать модель, вы хотите соответствовать использованию formula входной параметр к fitlme.

В общем случае формула для спецификации модели является вектором символов или строковым скаляром формы 'y ~ terms'. Для линейных моделей смешанных эффектов эта формула находится в форме 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed содержит термины фиксированных эффектов и random1, ..., randomR содержите термины случайных эффектов. Например, для предыдущего эксперимента удобрения, рассмотрите следующую модель смешанных эффектов

$y_{i m j k} = β_{0} + \sum_{m = 2}^{4} β_{1 m} I {[F]}_{i m} + \sum_{j = 2}^{5} β_{2 j} I {[T]}_{i j} + b_{0 k} S_{k} + b_{0 j k} {(S * T)}_{j k} + ε_{i m j k},$

где i = 1, 2..., 60, индекс, m соответствует типам удобрения, j, соответствует томатным типам, и k = 1, 2, 3 соответствует блокам (почва). S _k представляет k th тип грунта и I [F]_{, im} является фиктивным переменным уровнем представления m удобрения. Точно так же I [T] _ij является фиктивной переменной, представляющей уровень j томатного типа.

Можно подбирать эту модель с помощью формулы 'Yield ~ 1 + Fertilizer + Tomato + (1|Soil)+(1|Soil:Tomato)'.

Для получения дальнейшей информации о том, как задать вашу модель с помощью формулы, смотрите Отношение Между Матрицами Формулы и Проекта.

Спроектируйте матрицы

Если вы не можете легко описать свою модель с помощью формулы, можно создать матрицы проекта, чтобы задать фиксированные и случайные эффекты и подбирать модель с помощью fitlmematrix(X,y,Z,G). Необходимо создать матрицы проекта можно следующим образом.

Фиксированные эффекты и случайные эффекты проектируют матрицы X и Z:

Введите столбец 1 с для точки пересечения с помощью ones(n,1), где n является общим количеством наблюдений.
Если X1 непрерывная переменная, затем введите X1 когда это находится в отдельном столбце.
Если X1 категориальная переменная с уровнями m, затем должен быть m – 1 фиктивная переменная для m – 1 уровень X1 в X.
Например, рассмотрите эксперимент, где вы хотите изучить удар качества сырья от четырех различных провайдеров на производительности поточной линии. Если вы подбираете линейную модель смешанных эффектов с точкой пересечения и провайдером как термины фиксированных эффектов, точка пересечения является термином случайных эффектов, и вы используете ссылочное кодирование контрастов, то необходимо создать матрицы, построенные на основе фиксированных или случайных эффектов можно следующим образом.
```
D = dummyvar(provider); % Create dummy variables
X = [ones(n,1) D(:,2) D(:,3) D(:,4)];
Z = [ones(n,1)];
```
Поскольку ссылочное кодирование контраста использует первого провайдера в качестве ссылки, и модель имеет точку пересечения, необходимо использовать фиктивные переменные только для последних трех провайдеров.
Если существует период взаимодействия переменных предикторов X1 и X2, затем необходимо ввести столбец, что вы формируете поэлементным продуктом векторов X1 и X2.
Например, если вы хотите подобрать модель, где существует точка пересечения, фактор непрерывного лечения, непрерывный фактор времени и их взаимодействие как фиксированные эффекты в продольном исследовании, и время является термином случайных эффектов, затем ваши матрицы, построенные на основе фиксированных или случайных эффектов должны быть похожими
```
X = [ones(n,1),treatment,time,treatment.*time];
y = response;
Z = [time];
```

Сгруппированные переменные G:

Существует один столбец для каждой сгруппированной переменной и столбец поэлементного продукта сгруппированных переменных в случае вложения.

Например, если вы хотите сгруппировать графики (plot) в блоках (block), затем необходимо добавить столбец поэлементного продукта plot block. А именно, если вы хотите подобрать модель, где существует точка пересечения и фактор непрерывного лечения как фиксированные эффекты в эксперименте блока разделения, и точка пересечения и обработка сгруппированы графиками, вложенными в блоках, затем матрицы проекта должны выглядеть так.

X = [ones(n,1),treatment];
y = response;
Z = [ones(n,1),treatment];
G = [block.*plot];

Предположим в более раннем качестве примера сырья, сырье прибывают в объемы, и объемы вкладываются в провайдерах. Если вы хотите подбирать линейную модель смешанных эффектов, где точка пересечения сгруппирована объемами в провайдерах, то ваши матрицы проекта должны выглядеть так.

D = dummyvar(provider);
X = [ones(n,1) D(:,2) D(:,3) D(:,4)];
y = response;
Z = ones(n,1);
G = [provider.*bulks];

В более раннем продольном примере исследования, если вы хотите добавить случайные эффекты для точки пересечения и время, сгруппированное предметами, которые участвовали в исследовании, затем ваши матрицы проекта должны быть похожими

X = [ones(n,1),treatment,time, treatment.*time];
y = response;
Z = [ones(n,1),time];
G = subject;

Отношение матричной формы к таблицам и массивам набора данных

fitlme(tbl,formula) и fitlmematrix(X,y,Z,G) эквивалентны в функциональности, таковы что

y n-by-1 вектор отклика.
X n-by-p, фиксированные эффекты проектируют матрицу. fitlme построения это от выражения fixed в formula.
Z R-by-1 массив ячеек с Z{r} будучи n-by-q (r) случайные эффекты проектируют матрицу, созданную из r th выражение в random в formula, r = 1, 2..., R.
G R-by-1 массив ячеек с G{r} будучи n-by-1 сгруппированная переменная, g_r, в formula с M (r) уровни или группы.

Например, если tbl таблица или массив набора данных, содержащий переменную отклика y, непрерывные переменные X1 и X2, и сгруппированная переменная g, затем, чтобы подбирать линейную модель смешанных эффектов, которая соответствует выражению формулы 'y ~ X1+ X2+ (X1*X2|g)' использование fitlmematrix(X,y,Z,G) входные параметры должны соответствовать следующему:

y = tbl.y
X = [ones(n,1), tbl.X1, tbl.X2]
Z = [ones(n,1), tbl.X1, tbl.X2, tbl.X1.*tbl.X2]
G = tbl.g

Документация