LinearMixedModel class

Линейный класс модели смешанных эффектов

Описание

LinearMixedModel объект представляет модель переменной отклика с фиксированными и случайными эффектами. Это включает данные, описание модели, подходящие коэффициенты, параметры ковариации, матрицы проекта, остаточные значения, остаточные графики и другую диагностическую информацию для линейной модели смешанных эффектов. Можно предсказать ответы модели с predict функционируйте и сгенерируйте случайные данные в новых точках проекта с помощью random функция.

Конструкция

Можно подбирать линейную модель смешанных эффектов использование fitlme(tbl,formula) если ваши данные находятся в массиве набора данных или таблице. В качестве альтернативы, если ваша модель легко не описана с помощью формулы, можно создать матрицы, чтобы задать фиксированные и случайные эффекты и подбирать модель с помощью fitlmematrix(X,y,Z,G).

Входные параметры

развернуть все

`tbl` — Входные данные
таблица | `dataset` массив

Входные данные, который включает переменную отклика, переменные предикторы и сгруппированные переменные, заданные как таблица или dataset массив. Переменные предикторы могут быть непрерывными или сгруппированные переменные (см. Сгруппированные переменные). Необходимо задать модель для переменных с помощью formula.

Типы данных: table

`formula` — Формула для спецификации модели
вектор символов или скаляр строки формы `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

Формула для спецификации модели, заданной как вектор символов или скаляр строки формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Для полного описания смотрите Формулу.

Пример: 'y ~ treatment +(1|block)'

`X` — Фиксированные эффекты проектируют матрицу
n-by-p матрица

Фиксированные эффекты проектируют матрицу, заданную как n-by-p матрица, где n является количеством наблюдений, и p является количеством переменных предикторов фиксированных эффектов. Каждая строка X соответствует одному наблюдению и каждому столбцу X соответствует одной переменной.

Типы данных: single | double

`y` — Значения ответа
n-by-1 вектор

Значения ответа, заданные как n-by-1 вектор, где n является количеством наблюдений.

Типы данных: single | double

`Z` — Проект случайных эффектов
n-by-q матрица | массив ячеек R n-by-q (r) матрицы, r = 1, 2..., R

Проект случайных эффектов, заданный как любое из следующих.

Если существует один член в модели случайных эффектов, то Z должен быть n-by-q матрица, где n является количеством наблюдений, и q является количеством переменных в термине случайных эффектов.
Если существуют условия случайных эффектов R, то Z должен быть массив ячеек длины R. Каждая ячейка Z содержит n-by-q (r) матрица проекта Z{r}, r = 1, 2..., R, соответствуя каждому термину случайных эффектов. Здесь, q (r) является количеством случайного термина эффектов в r th, случайные эффекты проектируют матрицу, Z{r}.

Типы данных: single | double | cell

`G` — Сгруппированная переменная или переменные
n-by-1 вектор | массив ячеек R n-by-1 векторы

Сгруппированная переменная или переменные, заданные как любое из следующих.

Если существует один термин случайных эффектов, то G должен быть n-by-1 вектор, соответствующий одной сгруппированной переменной с уровнями M или группами.
G может быть категориальный вектор, логический вектор, числовой вектор, символьный массив, массив строк или массив ячеек из символьных векторов.
Если существует несколько условий случайных эффектов, то G должен быть массив ячеек длины R. Каждая ячейка G содержит сгруппированную переменную G{r}, r = 1, 2..., R, с M (r) уровни.
G{r} может быть категориальный вектор, логический вектор, числовой вектор, символьный массив, массив строк или массив ячеек из символьных векторов.

Свойства

развернуть все

`Coefficients` — Содействующие оценки фиксированных эффектов
массив набора данных

Коэффициент фиксированных эффектов оценивает и связанная статистика, сохраненная как массив набора данных, содержащий следующие поля.

`Name`	Имя термина.
`Estimate`	Ориентировочная стоимость коэффициента.
`SE`	Стандартная погрешность коэффициента.
`tStat`	t- для тестирования нулевой гипотезы, которую равен нулю коэффициент.
`DF`	Степени свободы для t - тест. Метод, чтобы вычислить `DF` задан `'DFMethod'` аргумент пары "имя-значение". `Coefficients` всегда использует `'Residual'` метод для `'DFMethod'`.
`pValue`	p - значение для t - тест.
`Lower`	Нижний предел доверительного интервала для коэффициента. `Coefficients` всегда использует 95%-й доверительный уровень, т.е. `'alpha'` 0.05.
`Upper`	Верхний предел доверительного интервала для коэффициента. `Coefficients` всегда использует 95%-й доверительный уровень, т.е. `'alpha'` 0.05.

Можно изменить 'DFMethod' и 'alpha' в то время как вычислительные доверительные интервалы для или зафиксированное включение гипотез тестирования - и случайные эффекты, с помощью coefCI и coefTest методы.

`CoefficientCovariance` — Ковариация предполагаемых коэффициентов фиксированных эффектов
p-by-p матрица

Ковариация предполагаемых коэффициентов фиксированных эффектов линейной модели смешанных эффектов, сохраненной как p-by-p матрица, где p является количеством коэффициентов фиксированных эффектов.

Можно отобразить параметры ковариации, сопоставленные со случайными эффектами с помощью covarianceParameters метод.

Типы данных: double

`CoefficientNames` — Имена коэффициентов фиксированных эффектов
1 p массивом ячеек из символьных векторов

Имена коэффициентов фиксированных эффектов линейной модели смешанных эффектов, сохраненной как 1 p массивом ячеек из символьных векторов.

Типы данных: cell

`DFE` — Остаточные степени свободы
положительное целочисленное значение

Остаточные степени свободы, сохраненные как положительное целочисленное значение. DFE = n – p, где n является количеством наблюдений и p, является количеством коэффициентов фиксированных эффектов.

Это соответствует 'Residual' метод вычисления степеней свободы в fixedEffects и randomEffects методы.

Типы данных: double

`FitMethod` — Метод раньше подбирал линейную модель смешанных эффектов
`ML` | `REML`

Метод раньше подбирал линейную модель смешанных эффектов, сохраненную как любое из следующих.

ML, если подходящий метод является наибольшим правдоподобием
REML, если подходящий метод является ограниченным наибольшим правдоподобием

Типы данных: char

`Formula` — Спецификация фиксированного - и условия случайных эффектов и сгруппированные переменные
объект

Спецификация условий фиксированных эффектов, условий случайных эффектов и сгруппированных переменных, которые задают линейную модель смешанных эффектов, сохраненную как объект.

Для получения дополнительной информации о том, как задать модель, чтобы соответствовать использованию формулы, видеть Формулу.

`LogLikelihood` — Максимизируемый журнал или ограниченная логарифмическая вероятность
скалярное значение

Максимизируемая логарифмическая вероятность или максимизируемая ограниченная логарифмическая вероятность подбиравшей линейной модели смешанных эффектов в зависимости от подходящего метода вы выбираете, сохраненный как скалярное значение.

Типы данных: double

`ModelCriterion` — Критерий модели
массив набора данных

Критерий модели, чтобы выдержать сравнение подбирал линейные модели смешанных эффектов, сохраненные как массив набора данных следующими столбцами.

`AIC`	Критерий информации о Akaike
`BIC`	Байесов информационный критерий
`Loglikelihood`	Регистрируйте значение вероятности модели
`Deviance`	– 2 раза логарифмическая вероятность модели

Если n является количеством наблюдений, используемых в том, чтобы подбирать модель, и p является количеством коэффициентов фиксированных эффектов, то для вычисления AIC и BIC,

Общим количеством параметров является nc + p + 1, где nc является общим количеством параметров в ковариации случайных эффектов, исключая остаточное отклонение
Эффективное количество наблюдений
- n, когда подходящий метод является наибольшим правдоподобием (ML)
- n p, когда подходящий метод является ограниченным наибольшим правдоподобием (REML)

`MSE` — ML или оценка REML
значение положительной скалярной величины

ML или оценка REML, на основе подходящего метода, используемого в оценке ^σ2, сохраненный как значение положительной скалярной величины. ^σ2 является остаточным отклонением или отклонением остаточного члена наблюдения линейной модели смешанных эффектов.

Типы данных: double

`NumCoefficients` — Количество коэффициентов фиксированных эффектов
положительное целочисленное значение

Количество коэффициентов фиксированных эффектов в подбиравшей линейной модели смешанных эффектов, сохраненной как положительное целочисленное значение.

Типы данных: double

`NumEstimatedCoefficients` — Количество предполагаемых коэффициентов фиксированных эффектов
положительное целочисленное значение

Количество предполагаемых коэффициентов фиксированных эффектов в подбиравшей линейной модели смешанных эффектов, сохраненной как положительное целочисленное значение.

Типы данных: double

`NumObservations` — Количество наблюдений
положительное целочисленное значение

Количество наблюдений используется в подгонке, сохраненной как положительное целочисленное значение. Это - количество строк в таблице или массиве набора данных или матрицах проекта минус исключенные строки или строки с NaN значения.

Типы данных: double

`NumPredictors` — Количество предикторов
положительное целочисленное значение

Количество переменных, используемых в качестве предикторов в линейной модели смешанных эффектов, сохраненной как положительное целочисленное значение.

Типы данных: double

`NumVariables` — Общее количество переменных
положительное целочисленное значение

Общее количество переменных включая ответ и предикторы, сохраненные как положительное целочисленное значение.

Если выборочные данные находятся в таблице или массиве набора данных tbl'NumVariables' общее количество переменных в tbl включая переменную отклика.
Если подгонка основана на матричном входе, NumVariables общее количество столбцов в матрице предиктора или матриц и вектора отклика.

NumVariables включает переменные, если существует кто-либо, которые не используются в качестве предикторов или в качестве ответа.

Типы данных: double

`ObservationInfo` — Информация о наблюдениях
таблица

Информация о наблюдениях, используемых в подгонке, сохраненной как таблица.

ObservationInfo ссорится для каждого наблюдения и следующих четырех столбцов.

`Weights`	Значение взвешенной переменной для того наблюдения. Значение по умолчанию равняется 1.
`Excluded`	`true`, если наблюдение было исключено из подгонки с помощью `'Exclude'` аргумент пары "имя-значение", `false`, в противном случае. 1 обозначает `true` и 0 обозначает `false`.
`Missing`	`true`, если наблюдение было исключено из подгонки, потому что любое значение ответа или предиктора отсутствует, `false`, в противном случае. Отсутствующие значения включают `NaN` для числовых переменных, пустых ячеек для массивов ячеек, пустых строк для символьных массивов и `<undefined>` значение для категориальных массивов.
`Subset`	`true`, если наблюдение использовалось в подгонке, `false`, если это не использовалось, потому что это отсутствует или исключенное.

Типы данных: table

`ObservationNames` — Имена наблюдений
массив ячеек из символьных векторов

Имена наблюдений используются в подгонке, сохраненной как массив ячеек из символьных векторов.

Если данные находятся в таблице или массиве набора данных, tbl, содержа имена наблюдения, ObservationNames имеет те имена.
Если данные обеспечиваются в матрицах, или таблице или массиве набора данных без имен наблюдения, то ObservationNames массив пустой ячейки.

Типы данных: cell

`PredictorNames` — Имена предикторов
массив ячеек из символьных векторов

Имена переменных, которые вы используете в качестве предикторов в подгонке, сохраненной как массив ячеек из символьных векторов, который имеет ту же длину как NumPredictors.

Типы данных: cell

`ResponseName` — Имена переменной отклика
символьный вектор

Имя переменной, используемой в качестве переменной отклика в подгонке, сохраненной как вектор символов.

Типы данных: char

`Rsquared` — Пропорция изменчивости в ответе объяснена подобранной моделью
структура

Пропорция изменчивости в ответе, объясненном подобранной моделью, сохраненной как структура. Это - коэффициент кратной корреляции или R-squared. Rsquared имеет два поля.

Ordinary Значение R-squared, сохраненное как скалярное значение в структуре. Rsquared.Ordinary = 1 – SSE./SST

Adjusted

Значение R-squared, настроенное для количества коэффициентов фиксированных эффектов, сохраненных как скалярное значение в структуре.

Rsquared.Adjusted = 1 – (SSE./SST)*(DFT./DFE),

где DFE = n – p, DFT = n – 1, и n общее количество наблюдений, p количество коэффициентов фиксированных эффектов.

Типы данных: struct

`SSE` — Ошибочная сумма квадратов
значение положительной скалярной величины

Ошибочная сумма квадратов, то есть, сумма условных остаточных значений в квадрате, сохраненных как значение положительной скалярной величины.

SSE = sum((y – F).^2), где y вектор отклика и F подходящий условный ответ линейной модели смешанных эффектов. Условная модель имеет вклады и от зафиксированных и от случайных эффектов.

Типы данных: double

`SSR` — Сумма квадратов регрессии
значение положительной скалярной величины

Сумма квадратов регрессии, то есть, сумма квадратов, объясненная линейной регрессией смешанных эффектов, сохраненной как значение положительной скалярной величины. Это - сумма отклонений в квадрате адаптированных значений условного выражения от их среднего значения.

SSR = sum((F – mean(F)).^2), где F подходящий условный ответ линейной модели смешанных эффектов. Условная модель имеет вклады и от зафиксированных и от случайных эффектов.

Типы данных: double

`SST` — Полная сумма квадратов
значение положительной скалярной величины

Полная сумма квадратов, то есть, сумма отклонений в квадрате наблюдаемых значений ответа от их среднего значения, сохраненного как значение положительной скалярной величины.

SST = sum((y – mean(y)).^2) = SSR + SSE, где y вектор отклика.

Типы данных: double

`Variables` Переменные
таблица

Переменные, сохраненные как таблица.

Если подгонка основана на таблице или массиве набора данных tbl, затем Variables идентично tbl.
Если подгонка основана на матричном входе, то Variables таблица, содержащая все переменные в матрице предиктора или матрицах и переменной отклика.

Типы данных: table

`VariableInfo` — Информация о переменных
таблица

Информация о переменных, используемых в подгонке, сохраненной как таблица.

VariableInfo ссорится для каждой переменной и содержит следующие четыре столбца.

`Class`	Класс переменной (`'double'ячейка`, `'nominal'`, и так далее).
`Range`	Диапазон значений переменной. Для числовой переменной это - двухэлементный вектор формы `[min,max]`. Для ячейки или категориальной переменной, это - массив ячеек или категориальный массив, содержащий все уникальные значения переменной.
`InModel`	`true`, если переменная является предиктором в подобранной модели. `false`, если переменная не находится в подобранной модели.
`IsCategorical`	`true`, если переменная имеет тип, который обработан как категориальный предиктор, такой как ячейка, логическая, или категориальная, или если это задано как категориальное `'Categorical'` аргумент пары "имя-значение" `fit` метод. `false`, если это - непрерывный предиктор.

Типы данных: table

`VariableNames` — Имена переменных
массив ячеек из символьных векторов

Имена переменных используются в подгонке, сохраненной как массив ячеек из символьных векторов.

Если выборочные данные находятся в таблице или массиве набора данных tblИмена переменных содержит имена переменных в tbl.
Если выборочные данные находятся в матричном формате, то VariableInfo включает имена переменных, которые вы предоставляете, подбирая модель. Если вы не предоставляете имена переменных, то VariableInfo содержит имена по умолчанию.

Типы данных: cell

Методы

anova	Дисперсионный анализ для линейной модели смешанных эффектов
coefCI	Доверительные интервалы для коэффициентов линейной модели смешанных эффектов
coefTest	Тест гипотезы на фиксированных и случайных эффектах линейной модели смешанных эффектов
сравнение	Сравните линейные модели смешанных эффектов
covarianceParameters	Извлеките параметры ковариации линейной модели смешанных эффектов
designMatrix	Матрицы, построенные на основе фиксированных или случайных эффектов
disp	Отобразите линейную модель смешанных эффектов
подгонка	(Не Рекомендуемый) Подходящая линейная модель смешанных эффектов использование таблиц
fitmatrix	(Не Рекомендуемый) Подходящая линейная модель смешанных эффектов, использующая матрицы проекта
подходящий	Подходящие ответы из линейной модели смешанных эффектов
fixedEffects	Оценки фиксированных эффектов и связанной статистики
plotResiduals	Постройте остаточные значения линейной модели смешанных эффектов
предсказать	Предскажите ответ линейной модели смешанных эффектов
случайный	Сгенерируйте случайные ответы из подбиравшей линейной модели смешанных эффектов
randomEffects	Оценки случайных эффектов и связанной статистики
остаточные значения	Остаточные значения подбиравшей линейной модели смешанных эффектов
ответ	Вектор отклика линейной модели смешанных эффектов

Копировать семантику

Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов (MATLAB).

Примеры

свернуть все

Случайная модель прерывания с категориальным предиктором

Скрипт Open Live Script

Загрузите выборочные данные.

load flu

flu массив набора данных имеет Date переменная и 10 переменных, содержащих оцененные уровни гриппа (в 9 различных областях, оцененных от поисковых запросов Google®, плюс общенациональная оценка из Центра по контролю и профилактике заболеваний, CDC).

Чтобы подбирать линейно смешанную модель эффектов, ваши данные должны быть в правильно отформатированном массиве набора данных. Чтобы подбирать линейную модель смешанных эффектов с уровнями гриппа как ответы и область как переменный предиктор, объедините эти девять столбцов, соответствующих областям в массив. Новый массив набора данных, flu2, должен иметь переменную отклика, FluRate, номинальная переменная, Region, это показывает, какая область каждая оценка от, и сгруппированная переменная Date.

flu2 = stack(flu,2:10,'NewDataVarName','FluRate',...
    'IndVarName','Region');
flu2.Date = nominal(flu2.Date);

Подбирайте линейную модель смешанных эффектов с фиксированными эффектами для области и случайного прерывания, которое варьируется Date.

Поскольку область является номинальной переменной, fitlme берет первую область, NE, как ссылка и создает восемь фиктивных переменных, представляющих другие восемь областей. Например, $I [M i d A t l]$ фиктивная переменная, представляющая область MidAtl. Для получения дополнительной информации смотрите Фиктивные Переменные.

Соответствующая модель

$\begin{array}{l} y_{i m} = β_{0} + β_{1} I {[M i d A t l]}_{i} + β_{2} I {[E N C e n t r a l]}_{i} + β_{3} I {[W N C e n t r a l]}_{i} + β_{4} I {[S A t l]}_{i} \\ + β_{5} I {[E S C e n t r a l]}_{i} + β_{6} I {[W S C e n t r a l]}_{i} + β_{7} I {[M t n]}_{i} + β_{8} I {[P a c]}_{i} + b_{0 m} + ε_{i m}, m = 1, 2, . . ., 52, \end{array}$

где $y_{i m}$ наблюдение $i$ для уровня $m$ из сгруппированной переменной Date, $β_{j}$ , $j$ = 0, 1..., 8, коэффициенты фиксированных эффектов, $b_{0 m}$ случайный эффект для уровня $m$ из сгруппированной переменной Date, и $ε_{i m}$ ошибка наблюдения для наблюдения $i$ . Случайный эффект имеет предшествующее распределение, $b_{0 m} \sim N (0, σ_{b}^{2})$ и остаточный член имеет распределение, $ε_{i m} \sim N (0, σ^{2})$ .

lme = fitlme(flu2,'FluRate ~ 1 + Region + (1|Date)')

lme = 
Linear mixed-effects model fit by ML

Model information:
    Number of observations             468
    Fixed effects coefficients           9
    Random effects coefficients         52
    Covariance parameters                2

Formula:
    FluRate ~ 1 + Region + (1 | Date)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    318.71    364.35    -148.36          296.71  

Fixed effects coefficients (95% CIs):
    Name                        Estimate    SE          tStat      DF 
    {'(Intercept)'     }          1.2233    0.096678     12.654    459
    {'Region_MidAtl'   }        0.010192    0.052221    0.19518    459
    {'Region_ENCentral'}        0.051923    0.052221     0.9943    459
    {'Region_WNCentral'}         0.23687    0.052221     4.5359    459
    {'Region_SAtl'     }        0.075481    0.052221     1.4454    459
    {'Region_ESCentral'}         0.33917    0.052221      6.495    459
    {'Region_WSCentral'}           0.069    0.052221     1.3213    459
    {'Region_Mtn'      }        0.046673    0.052221    0.89377    459
    {'Region_Pac'      }        -0.16013    0.052221    -3.0665    459


    pValue        Lower        Upper    
     1.085e-31       1.0334       1.4133
       0.84534    -0.092429      0.11281
        0.3206    -0.050698      0.15454
    7.3324e-06      0.13424      0.33949
       0.14902     -0.02714       0.1781
    2.1623e-10      0.23655      0.44179
       0.18705    -0.033621      0.17162
       0.37191    -0.055948      0.14929
     0.0022936     -0.26276    -0.057514

Random effects covariance parameters (95% CIs):
Group: Date (52 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.6443  


    Lower     Upper  
    0.5297    0.78368

Group: Error
    Name               Estimate    Lower      Upper
    {'Res Std'}        0.26627     0.24878    0.285

$p$ - значения 7.3324e-06 и 2.1623e-10 соответственно показывают что фиксированные эффекты уровней гриппа в областях WNCentral и ESCentral существенно отличаются относительно уровней гриппа в области NE.

Пределы достоверности для стандартного отклонения термина случайных эффектов, $σ_{b}$ , не включайте 0 (0.5297, 0.78368), который указывает, что термин случайных эффектов является значительным. Можно также протестировать значение условий случайных эффектов с помощью compare метод.

Ориентировочная стоимость наблюдения является суммой фиксированных эффектов и значения случайного эффекта на уровне сгруппированной переменной, соответствующем тому наблюдению. Например, предполагаемый лучше всего линейный несмещенный предиктор (BLUP) уровня гриппа для области WNCentral на неделе 10/9/2005

$\begin{aligned} {y_{}^{ˆ}}_{W N C e n t r a l, 10 / 9 / 2005} & = {β_{}^{ˆ}}_{0} + {β_{}^{ˆ}}_{3} I [W N C e n t r a l] + {b_{}^{ˆ}}_{10 / 9 / 2005} \\ = 1 . 2233 + 0 . 23687 - 0 . 1718 \\ = 1 . 28837 . \end{aligned}$

Это - подходящий условный ответ, поскольку он включает вклад в оценку и от фиксированных и от случайных эффектов. Можно вычислить это значение можно следующим образом.

beta = fixedEffects(lme);
[~,~,STATS] = randomEffects(lme); % Compute the random-effects statistics (STATS)
STATS.Level = nominal(STATS.Level);
y_hat = beta(1) + beta(4) + STATS.Estimate(STATS.Level=='10/9/2005')

y_hat = 1.2884

Можно просто отобразить подходящее значение с помощью fitted метод.

F = fitted(lme);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')

ans = 1.2884

Вычислите подходящий крайний ответ для области WNCentral на неделе 10/9/2005.

F = fitted(lme,'Conditional',false);
F(flu2.Date == '10/9/2005' & flu2.Region == 'WNCentral')

ans = 1.4602

Линейная модель Смешанных Эффектов со случайным наклоном

Скрипт Open Live Script

Загрузите выборочные данные.

load carbig

Подбирайте линейную модель смешанных эффектов для миль на галлон (MPG), с фиксированными эффектами для ускорения, лошадиной силы и цилиндров и некоррелированого случайного эффекта для прерывания и ускорения, сгруппированного модельным годом. Эта модель соответствует

${M P G}_{i m} = β_{0} + β_{1} {A c c}_{i} + β_{2} H P + b_{0 m} + {b_{1}}_{m} {A c c}_{i m} + ε_{i m}, m = 1, 2, 3,$

с условиями случайных эффектов, имеющими следующие предшествующие распределения:

$b_{m} = (\begin{array}{l} b_{0 m} \\ b_{1 m} \end{array}) \sim N (0, (\begin{array}{cccccccccccccccccccc} σ_{0}^{2} & σ_{0, 1} \\ σ_{0, 1} & σ_{1}^{2} \end{array})),$

где $m$ представляет модельный год.

Во-первых, подготовьте матрицы проекта к тому, что они подбирали линейную модель смешанных эффектов.

X = [ones(406,1) Acceleration Horsepower];
Z = [ones(406,1) Acceleration];
Model_Year = nominal(Model_Year);
G = Model_Year;

Теперь подбирайте модель с помощью fitlmematrix с заданными матрицами проекта и сгруппированными переменными. Используйте 'fminunc' алгоритм оптимизации.

lme = fitlmematrix(X,MPG,Z,G,'FixedEffectPredictors',....
{'Intercept','Acceleration','Horsepower'},'RandomEffectPredictors',...
{{'Intercept','Acceleration'}},'RandomEffectGroups',{'Model_Year'},...
'FitMethod','REML')

lme = 
Linear mixed-effects model fit by REML

Model information:
    Number of observations             392
    Fixed effects coefficients           3
    Random effects coefficients         26
    Covariance parameters                4

Formula:
    Linear Mixed Formula with 4 predictors.

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    2202.9    2230.7    -1094.5          2188.9  

Fixed effects coefficients (95% CIs):
    Name                    Estimate    SE           tStat      DF 
    {'Intercept'   }          50.064       2.3176     21.602    389
    {'Acceleration'}        -0.57897      0.13843    -4.1825    389
    {'Horsepower'  }        -0.16958    0.0073242    -23.153    389


    pValue        Lower       Upper   
    1.4185e-68      45.507       54.62
    3.5654e-05    -0.85112    -0.30681
    3.5289e-75    -0.18398    -0.15518

Random effects covariance parameters (95% CIs):
Group: Model_Year (13 Levels)
    Name1                   Name2                   Type            Estimate
    {'Intercept'   }        {'Intercept'   }        {'std' }           3.72 
    {'Acceleration'}        {'Intercept'   }        {'corr'}        -0.8769 
    {'Acceleration'}        {'Acceleration'}        {'std' }         0.3593 


    Lower       Upper   
      1.5215      9.0954
    -0.98274    -0.33846
     0.19418     0.66483

Group: Error
    Name               Estimate    Lower     Upper 
    {'Res Std'}        3.6913      3.4331    3.9688

Фиксированное содействующее отображение эффектов включает оценку, стандартные погрешности (SE), и 95% пределов доверительного интервала (Lower и Upper). $p$ - значения для (pValue) укажите, что все три коэффициента фиксированных эффектов являются значительными.

Доверительные интервалы для стандартных отклонений и корреляции между случайными эффектами для прерывания и ускорения не включают нули, следовательно они кажутся значительными. Используйте compare метод, чтобы протестировать на случайные эффекты.

Отобразите ковариационную матрицу предполагаемых коэффициентов фиксированных эффектов.

lme.CoefficientCovariance

ans = 3×3

    5.3711   -0.2809   -0.0126
   -0.2809    0.0192    0.0005
   -0.0126    0.0005    0.0001

Диагональные элементы показывают отклонения содействующих оценок фиксированных эффектов. Например, отклонение оценки прерывания 5.3711. Обратите внимание на то, что стандартные погрешности оценок являются квадратными корнями из отклонений. Например, стандартная погрешность прерывания 2.3176, который является sqrt(5.3711).

Недиагональные элементы показывают корреляцию между содействующими оценками фиксированных эффектов. Например, корреляция между прерыванием и ускорением –0.2809 и корреляция между ускорением, и лошадиная сила 0.0005.

Отобразите коэффициент детерминации для модели.

lme.Rsquared

ans = struct with fields:
    Ordinary: 0.7826
    Adjusted: 0.7815

Настроенное значение является значением R-squared, настроенным для количества предикторов в модели.

Больше о

развернуть все

Формула

В общем случае формула для спецификации модели является вектором символов или скаляром строки формы 'y ~ terms'. Для линейных моделей смешанных эффектов эта формула находится в форме 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержите фиксированные эффекты и условия случайных эффектов.

Предположим таблица tbl содержит следующее:

Переменная отклика, y
Переменные предикторы, _Xj, который может быть непрерывным или сгруппированные переменные
Сгруппированные переменные, _g1, _g2..., _gR,

где сгруппированные переменные в _Xj и _gr может быть категориальным, логическим, символьные массивы, строковые массивы или массивы ячеек из символьных векторов.

Затем в формуле формы, _{'y ~ fixed + (random1|g1) + ... + (randomR|gR)'}, термин fixed соответствует спецификации проекта фиксированных эффектов матричный X, random₁ спецификация проекта случайных эффектов матричный Z₁ соответствие сгруппированной переменной g₁, и так же random_R является спецификацией проекта случайных эффектов матричный Z_R, соответствующий сгруппированной переменной g_R. Можно выразить fixed и random условия с помощью обозначения Уилкинсона.

Обозначение Уилкинсона описывает факторы, существующие в моделях. Обозначение относится к факторам, существующим в моделях, не ко множителям (коэффициенты) тех факторов.

Обозначение Уилкинсона	Включает стандартное обозначение
1	Постоянный (прерывание) термин
`X^k`, где `k` положительное целое число	`X^x2`..., `^Xk`
`X1 + X2`	`X1x2`
`X1*X2`	`X1x2` , `X1.*X2 (elementwise multiplication of X1 and X2)`
`X1:X2`	`X1.*X2` только
`- X2`	Не включайте `X2`
`X1*X2 + X3`	`X1x2` , `X3x1, x2`
`X1 + X2 + X3 + X1:X2`	`X1x2` , `X3x1, x2`
`X1X2X3 - X1:X2:X3`	`X1x2` , `X3x1, x2` , `X1X3`, `X2X3`
`X1*(X2 + X3)`	`X1x2` , `X3x1, x2` , `X1*X3`

Обозначение Statistics and Machine Learning Toolbox™ всегда включает постоянный термин, если вы явным образом не удаляете термин с помощью -1. Вот некоторые примеры для линейной спецификации модели смешанных эффектов.

Примеры:

Формула	Описание
`'y ~ X1 + X2'`	Фиксированные эффекты для прерывания, `X1` и `X2`. Это эквивалентно `'y ~ 1 + X1 + X2'`.
`'y ~ -1 + X1 + X2'`	Никакое прерывание и зафиксированные эффекты для `X1` и `X2`. Неявный термин прерывания подавлен включением `-1`.
`'y ~ 1 + (1 \| g1)'`	Фиксированные эффекты для прерывания плюс случайный эффект для прерывания для каждого уровня сгруппированной переменной `g1`.
`'y ~ X1 + (1 \| g1)'`	Случайная модель прерывания с фиксированным наклоном.
`'y ~ X1 + (X1 \| g1)'`	Случайное прерывание и наклон, с возможной корреляцией между ними. Это эквивалентно `'y ~ 1 + X1 + (1 + X1\|g1)'`.
`'y ~ X1 + (1 \| g1) + (-1 + X1 \| g1)'`	Независимые случайные эффекты называют для прерывания и наклона.
`'y ~ 1 + (1 \| g1) + (1 \| g2) + (1 \| g1:g2)'`	Случайная модель прерывания с независимыми основными эффектами для `g1` и `g2`, плюс независимый эффект взаимодействия.

Документация

LinearMixedModel class

Описание

Конструкция

Входные параметры

tbl — Входные данные таблица | dataset массив

formula — Формула для спецификации модели вектор символов или скаляр строки формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'

X — Фиксированные эффекты проектируют матрицу n-by-p матрица

y — Значения ответа n-by-1 вектор

Z — Проект случайных эффектов n-by-q матрица | массив ячеек R n-by-q (r) матрицы, r = 1, 2..., R

G — Сгруппированная переменная или переменные n-by-1 вектор | массив ячеек R n-by-1 векторы

Свойства

Coefficients — Содействующие оценки фиксированных эффектов массив набора данных

CoefficientCovariance — Ковариация предполагаемых коэффициентов фиксированных эффектов p-by-p матрица

CoefficientNames — Имена коэффициентов фиксированных эффектов 1 p массивом ячеек из символьных векторов

DFE — Остаточные степени свободы положительное целочисленное значение

FitMethod — Метод раньше подбирал линейную модель смешанных эффектов ML | REML

Formula — Спецификация фиксированного - и условия случайных эффектов и сгруппированные переменные объект

LogLikelihood — Максимизируемый журнал или ограниченная логарифмическая вероятность скалярное значение

ModelCriterion — Критерий модели массив набора данных

MSE — ML или оценка REML значение положительной скалярной величины

NumCoefficients — Количество коэффициентов фиксированных эффектов положительное целочисленное значение

NumEstimatedCoefficients — Количество предполагаемых коэффициентов фиксированных эффектов положительное целочисленное значение

NumObservations — Количество наблюдений положительное целочисленное значение

NumPredictors — Количество предикторов положительное целочисленное значение

NumVariables — Общее количество переменных положительное целочисленное значение

ObservationInfo — Информация о наблюдениях таблица

ObservationNames — Имена наблюдений массив ячеек из символьных векторов

PredictorNames — Имена предикторов массив ячеек из символьных векторов

ResponseName — Имена переменной отклика символьный вектор

Rsquared — Пропорция изменчивости в ответе объяснена подобранной моделью структура

SSE — Ошибочная сумма квадратов значение положительной скалярной величины

SSR — Сумма квадратов регрессии значение положительной скалярной величины

SST — Полная сумма квадратов значение положительной скалярной величины

Variables Переменные таблица

VariableInfo — Информация о переменных таблица

VariableNames — Имена переменных массив ячеек из символьных векторов

Методы

Копировать семантику

Примеры

Случайная модель прерывания с категориальным предиктором

Линейная модель Смешанных Эффектов со случайным наклоном

Больше о

Формула

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

`tbl` — Входные данные
таблица | `dataset` массив

`formula` — Формула для спецификации модели
вектор символов или скаляр строки формы `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

`X` — Фиксированные эффекты проектируют матрицу
n-by-p матрица

`y` — Значения ответа
n-by-1 вектор

`Z` — Проект случайных эффектов
n-by-q матрица | массив ячеек R n-by-q (r) матрицы, r = 1, 2..., R

`G` — Сгруппированная переменная или переменные
n-by-1 вектор | массив ячеек R n-by-1 векторы

`Coefficients` — Содействующие оценки фиксированных эффектов
массив набора данных

`CoefficientCovariance` — Ковариация предполагаемых коэффициентов фиксированных эффектов
p-by-p матрица

`CoefficientNames` — Имена коэффициентов фиксированных эффектов
1 p массивом ячеек из символьных векторов

`DFE` — Остаточные степени свободы
положительное целочисленное значение

`FitMethod` — Метод раньше подбирал линейную модель смешанных эффектов
`ML` | `REML`

`Formula` — Спецификация фиксированного - и условия случайных эффектов и сгруппированные переменные
объект

`LogLikelihood` — Максимизируемый журнал или ограниченная логарифмическая вероятность
скалярное значение

`ModelCriterion` — Критерий модели
массив набора данных

`MSE` — ML или оценка REML
значение положительной скалярной величины

`NumCoefficients` — Количество коэффициентов фиксированных эффектов
положительное целочисленное значение

`NumEstimatedCoefficients` — Количество предполагаемых коэффициентов фиксированных эффектов
положительное целочисленное значение

`NumObservations` — Количество наблюдений
положительное целочисленное значение

`NumPredictors` — Количество предикторов
положительное целочисленное значение

`NumVariables` — Общее количество переменных
положительное целочисленное значение

`ObservationInfo` — Информация о наблюдениях
таблица

`ObservationNames` — Имена наблюдений
массив ячеек из символьных векторов

`PredictorNames` — Имена предикторов
массив ячеек из символьных векторов

`ResponseName` — Имена переменной отклика
символьный вектор

`Rsquared` — Пропорция изменчивости в ответе объяснена подобранной моделью
структура

`SSE` — Ошибочная сумма квадратов
значение положительной скалярной величины

`SSR` — Сумма квадратов регрессии
значение положительной скалярной величины

`SST` — Полная сумма квадратов
значение положительной скалярной величины

`Variables` Переменные
таблица

`VariableInfo` — Информация о переменных
таблица

`VariableNames` — Имена переменных
массив ячеек из символьных векторов