GeneralizedLinearMixedModel class

Обобщенный класс модели линейных смешанных эффектов

Описание

A GeneralizedLinearMixedModel объект представляет регрессионную модель переменной отклика, которая содержит как фиксированные, так и случайные эффекты. Объект содержит данные, описание модели, подобранные коэффициенты, ковариационные параметры, матрицы проекта, невязки, остаточные графики и другую диагностическую информацию для обобщенной модели линейных смешанных эффектов (GLME). Можно предсказать ответы модели с помощью predict и генерируйте случайные данные в новых проектных точках, используя random функция.

Конструкция

Можно подгонять обобщенную модель линейных смешанных эффектов (GLME) для выборочных данных с помощью fitglme(tbl,formula). Для получения дополнительной информации см. fitglme.

Входные параметры

расширить все

`tbl` - Входные данные
таблица | массив набора данных

Входные данные, который включает переменную отклика, переменные предиктора и сгруппированные переменные, заданные как таблица или массив набора данных. Переменные предиктора могут быть непрерывными или сгруппированные переменные (см. Сгруппированные переменные). Вы должны задать модель для переменных, используя formula.

Типы данных: table

`formula` - Формула для спецификации модели
вектор символов или строковый скаляр вида `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

Формула для спецификации модели, заданная как вектор символов или строковый скаляр вида 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Полное описание см. в Формуле.

Пример: 'y ~ treatment +(1|block)'

Свойства

расширить все

`Coefficients` - Оценки коэффициентов фиксированных эффектов
массив набора данных

Оценки коэффициентов с фиксированными эффектами и связанной статистики, сохраненные как массив набора данных, который имеет одну строку для каждого коэффициента и следующие столбцы:

Name - Имя коэффициента
Estimate - Расчетное значение коэффициента
SE - Стандартная ошибка оценки
tStat - t -статистический для теста, что коэффициент равен 0
DF - Степени свободы, связанные с t статистикой
pValue - p -value для t -statistic
Lower - Нижний доверительный предел
Upper - Верхний доверительный предел

Чтобы получить любой из этих столбцов в качестве вектора, индексируйте в свойство с помощью записи через точку.

Используйте coefTest метод для выполнения других тестов коэффициентов.

`CoefficientCovariance` - Ковариация предполагаемого вектора с фиксированными эффектами
матрица

Ковариация предполагаемого вектора с фиксированными эффектами, сохраненная в виде матрицы.

Типы данных: single | double

`CoefficientNames` - Имена коэффициентов с фиксированными эффектами
массив ячеек из векторов символов

Имена коэффициентов с фиксированными эффектами, сохраненные как массив ячеек из векторов символов. Метка для коэффициента постоянного члена (Intercept). Метки для других коэффициентов указывают условия, которые они умножают. Когда термин включает категориальный предиктор, метка также указывает уровень этого предиктора.

Типы данных: cell

`DFE` - Степени свободы для ошибки
положительное целое значение

Степени свободы от ошибки, сохраненные как положительное целое значение. DFE количество наблюдений минус количество оцененных коэффициентов.

DFE содержит степени свободы, соответствующие 'Residual' способ вычисления знаменательных степеней свободы для проверки гипотез на коэффициентах с фиксированными эффектами. Если n - количество наблюдений, а p - количество коэффициентов с фиксированными эффектами, то DFE равно n - p.

Типы данных: double

`Dispersion` - Модель параметра дисперсии
скалярное значение

Моделируйте параметр дисперсии, сохраненный в виде скалярного значения. Параметр дисперсии задает условное отклонение отклика.

Для i наблюдений условное отклонение отклика y i, учитывая условное среднее _мкi и параметр дисперсии σ², в обобщенной линейной модели смешанных эффектов,

$var (y_{i} | μ_{i}, σ^{2}) = \frac{σ^{2}}{w_{i}} v (μ_{i}),$

где w i - i-й вес наблюдения, а v - функция отклонения для заданного условного распределения отклика. The Dispersion свойство содержит оценку σ² для указанной модели GLME. Значение Dispersion зависит от заданного условного распределения отклика. Для биномиальных и Пуассоновых распределений теоретическое значение Dispersion равно σ² = 1.0.

Если FitMethod является MPL или REMPL и 'DispersionFlag' аргумент пары "имя-значение" в fitglme является true, затем параметр дисперсии оценивается из данных для всех распределений, включая биномиальные и распределения Пуассона.
Если FitMethod является ApproximateLaplace или Laplace, затем 'DispersionFlag' аргумент пары "имя-значение" в fitglme не применяется, и параметр дисперсии фиксируется на уровне 1.0 для биномиальных и пуассоновских распределений. Для всех других распределений Dispersion оценивается из данных.

Типы данных: double

`DispersionEstimated` - Флаг, указывающий, был ли оценен параметр дисперсии
`true` | `false`

Флаг, указывающий предполагаемый параметр дисперсии, сохраненный как логическое значение.

Если FitMethod является ApproximateLaplace или Laplace, затем параметр дисперсии фиксируется на своем теоретическом значении 1,0 для биномиальных и пуассоновских распределений, и DispersionEstimated является false. Для других распределений параметр дисперсии оценивается из данных и DispersionEstimated является true.
Если FitMethod является MPL или REMPL, и 'DispersionFlag' аргумент пары "имя-значение" в fitglme задается как true, затем параметр дисперсии оценивается для всех распределений, включая биномиальные и Пуассоновские распределения, и DispersionEstimated является true.
Если FitMethod является MPL или REMPL, и 'DispersionFlag' аргумент пары "имя-значение" в fitglme задается как false, затем параметр дисперсии фиксируется на своем теоретическом значении для биномиальных и пуассоновских распределений, и DispersionEstimated является false. Для распределений, отличных от биномиальных и Пуассона, параметр дисперсии оценивается из данных и DispersionEstimated является true.

Типы данных: logical

`Distribution` - имя распределения отклика
`'Normal'` | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

Имя распределения отклика, сохраненное как одно из следующего:

'Normal' - Нормальное распределение
'Binomial' - Биномиальное распределение
'Poisson' - Распределение Пуассона
'Gamma' - Гамма-распределение
'InverseGaussian' - Обратное Гауссово распределение

`FitMethod` - Метод, используемый для подгонки модели
`'MPL'` | `'REMPL'` | `'ApproximateLaplace'` | `'Laplace'`

Метод, используемый для подгонки модели, хранится как одно из следующего.

'MPL' - Максимальная псевдоправдоподобность
'REMPL' - Ограниченная максимальная псевдоподобность
'ApproximateLaplace' - Максимальная правдоподобность с использованием приблизительного метода Лапласа, с профилированными фиксированными эффектами
'Laplace' - Максимальная вероятность с использованием метода Лапласа

`Formula` - Формула спецификации модели
объект

Формула спецификации модели, сохраненная как объект. Формула спецификации модели использует обозначение Уилкинсона, чтобы описать связь между терминами фиксированных эффектов, терминами случайных эффектов и сгруппированными переменными в модели GLME. Для получения дополнительной информации смотрите Формулу.

`Link` - Характеристики функции ссылки
структура

Ссылка на характеристики функции, сохраненная как структура, содержащая следующие поля. Ссылка является функцией G который связывает параметр распределения MU к линейному предиктору ETA следующим образом: G(MU) = ETA.

Область	Описание
`Name`	Имя функции ссылки
`Link`	Функция, которая задает `G`
`Derivative`	Производная от `G`
`SecondDerivative`	Вторая производная `G`
`Inverse`	Обратная `G`

Типы данных: struct

`LogLikelihood` - Журнал функции правдоподобия
скалярное значение

Логарифмическая функция правдоподобия, оцененная по оцененным значениям коэффициентов, сохранена в виде скалярного значения. LogLikelihood зависит от метода, используемого для подгонки модели.

Если вы используете 'Laplace' или 'ApproximateLaplace', затем LogLikelihood является максимальным журналом вероятностью.
Если вы используете 'MPL', затем LogLikelihood является максимизированной журналом вероятностью псевдопроверки данных от конечной итерации псевдопроверки.
Если вы используете 'REMPL', затем LogLikelihood является максимально ограничивать журналом вероятностью псевдослучайных данных от конечной итерации псевдослучайности.

Типы данных: double

`ModelCriterion` - Критерий модели
таблица

Критерий модели для сравнения подобранных обобщенных линейных моделей смешанных эффектов, сохраненных как таблица со следующими полями.

Область	Описание
`AIC`	Информационный критерий Акайке
`BIC`	Байесовский информационный критерий
`LogLikelihood`	Для модели подгонки используя `'Laplace'` или `'ApproximateLaplace'`, `LogLikelihood` является максимальным журналом вероятностью. Для модели подгонки используя `'MPL'`, `LogLikelihood` является максимизированной журналом вероятностью псевдопроверки данных от конечной итерации псевдопроверки. Для модели подгонки используя `'REMPL'`, `LogLikelihood` является максимально ограничивать журналом вероятностью псевдослучайных данных от конечной итерации псевдослучайности.
`Deviance`	-2 раза `LogLikelihood`

`NumCoefficients` - Количество коэффициентов с фиксированными эффектами
положительное целое значение

Количество коэффициентов с фиксированными эффектами в подобранной обобщенной линейной модели с смешанными эффектами, сохраненное в виде положительного целого значения.

Типы данных: double

`NumEstimatedCoefficients` - Количество расчетных коэффициентов фиксированных эффектов
положительное целое значение

Количество оцененных коэффициентов фиксированных эффектов в подобранной обобщенной линейной модели смешанных эффектов, сохраненное в виде положительного целого значения.

Типы данных: double

`NumObservations` - Количество наблюдений
положительное целое значение

Количество наблюдений, используемых в подгонке, сохраненных в виде положительного целого значения. NumObservations количество строк в таблице или массиве наборов данных tbl, минус строки, исключенные с помощью 'Exclude' пара "имя-значение" fitglme или строки, содержащие NaN значения.

Типы данных: double

`NumPredictors` - Количество предикторов
положительное целое значение

Количество переменных, используемых в качестве предикторов в обобщенной модели линейных смешанных эффектов, сохраненных в виде положительного целого значения.

Типы данных: double

`NumVariables` - Общее количество переменных
положительное целое значение

Общее количество переменных, включая ответ и предикторы, сохраненных в виде положительного целого значения. Если выборочные данные находятся в таблице или массиве набора данных tbl, затем NumVariables - общее количество переменных в tbl, включая переменную отклика. NumVariables включает переменные, если таковые имеются, которые не используются в качестве предикторов или в качестве отклика.

Типы данных: double

`ObservationInfo` - Информация о наблюдениях
таблица

Информация о наблюдениях, используемых в подгонке, хранится в виде таблицы.

ObservationInfo имеет по одной строке для каждого наблюдения и следующих столбцов.

Имя	Описание
`Weights`	Значение веса для наблюдения. Значение по умолчанию является 1.
`Excluded`	Если наблюдение было исключено из подгонки с помощью `'Exclude'` аргумент пары "имя-значение" в `fitglme`, затем `Excluded` является `true`, или `1`. В противном случае `Excluded` является `false`, или `0`.
`Missing`	Если наблюдение было исключено из подгонки, потому что отсутствует какой-либо ответ или значение предиктора, то `Missing` является `true`. В противном случае `Missing` является `false`. Отсутствующие значения включают `NaN` для числовых переменных, пустых камер для массивов ячеек, пустых строк для символьных массивов и `<undefined>` значение для категориальных массивов.
`Subset`	Если наблюдение использовалось в подгонке, то `Subset` является `true`. Если наблюдение не использовалось в подгонке, потому что оно отсутствует или исключено, то `Subset` является `false`.
`BinomSize`	Биномиальный размер для каждого наблюдения. Этот столбец применяется только при подборе биномиального распределения.

Типы данных: table

`ObservationNames` - Имена наблюдений
массив ячеек из векторов символов

Имена наблюдений, используемых в подгонке, хранятся как массив ячеек из векторов символов.

Если данные находятся в таблице или массиве набора данных tbl который содержит имена наблюдений, затем ObservationNames использует эти имена.
Если данные предоставлены в матрицах или в массиве таблицы или набора данных без имен наблюдений, то ObservationNames - пустой массив ячеек.

Типы данных: cell

`PredictorNames` - Имена предикторов
массив ячеек из векторов символов

Имена переменных, используемых в качестве предикторов в подгонке, хранятся в виде массива ячеек из векторов символов, который имеет ту же длину, что и NumPredictors.

Типы данных: cell

`ResponseName` - Имя переменной отклика
вектор символов

Имя переменной, используемой в качестве переменной отклика в подгонке, сохраненное в виде вектора символов.

Типы данных: char

`Rsquared` - Доля изменчивости в отклике, объясняемая подобранной моделью
структура

Доля изменчивости в отклике, объясняемая подобранной моделью, сохраненной как структура. Rsquared содержит R -squared значение подобранной модели, также известное как множественный коэффициент корреляции. Rsquared содержит следующие поля.

Область Описание

Ordinary R-квадрат, сохраненный как скалярное значение в структуре.
Rsquared.Ordinary = 1 — SSE./SST

Adjusted R-квадратичное значение, скорректированное для количества коэффициентов с фиксированными эффектами, сохраненное в виде скалярного значения в структуре.
Rsquared.Adjusted = 1 — (SSE./SST)*(DFT./DFE),
где DFE = n – p, DFT = n – 1, n - общее количество наблюдений и p - количество коэффициентов с фиксированными эффектами.

Область	Описание
`Ordinary`	R-квадрат, сохраненный как скалярное значение в структуре. `Rsquared.Ordinary = 1 — SSE./SST`
`Adjusted`	R-квадратичное значение, скорректированное для количества коэффициентов с фиксированными эффектами, сохраненное в виде скалярного значения в структуре. `Rsquared.Adjusted = 1 — (SSE./SST)*(DFT./DFE)`, где `DFE = n – p`, `DFT = n – 1`, `n` - общее количество наблюдений и `p` - количество коэффициентов с фиксированными эффектами.

Типы данных: struct

`SSE` - Сумма ошибок квадратов
положительное скалярное значение

Сумма ошибок квадратов, сохраненная как положительная скалярная величина значение. SSE является взвешенной суммой квадратов условных невязок и вычисляется как

$S S E = \sum_{i = 1}^{n} w_{i}^{e f f} {(y_{i} - f_{i})}^{2},$

где n количество наблюдений, _wi^eff - i-й эффективный вес, _yi - i-й ответ, и fi - i-е подобранное значение.

i эффективный вес вычисляется как

$w_{i}^{e f f} = {\frac{w_{i}}{v_{i} (μ_{i} (\hat{β}, \hat{b}))}},$

где _vi - член отклонения для i-го наблюдения , $\hat{β}$ и $\hat{b}$ - оценочные значения β и b, соответственно.

i-е установленное значение вычисляется как

$f_{i} = g^{- 1} (x_{i}^{T} \hat{β} + z_{i}^{T} \hat{b} + δ_{i}),$

где _xi^T - i строка матричных X с фиксированными эффектами, и _zi^T - i строка матричного Z случайных эффектов. _δi - i-е значение смещения.

Типы данных: double

`SSR` - Регрессионная сумма квадратов
положительное скалярное значение

Регрессионная сумма квадратов, сохраненная как положительная скалярная величина значение. SSR - сумма квадратов, объясненная обобщенной линейной регрессией смешанных эффектов или эквивалентно взвешенная сумма квадратов отклонений условных подобранных значений от их взвешенного среднего. SSR вычисляется как

$S S R = \sum_{i = 1}^{N} w_{i}^{e f f} {(f_{i} - \bar{f})}^{2},$

где n количество наблюдений, _wi^eff - i-й эффективный вес, _fi - i-е установленное значение, и $\bar{f}$ - взвешенное среднее значение подобранных значений.

i эффективный вес вычисляется как

$w_{i}^{e f f} = {\frac{w_{i}}{v_{i} (μ_{i} (\hat{β}, \hat{b}))}},$

где $\hat{β}$ и $\hat{b}$ - оценочные значения β и b, соответственно.

i-е установленное значение вычисляется как

$f_{i} = g^{- 1} (x_{i}^{T} \hat{β} + z_{i}^{T} \hat{b} + δ_{i}),$

Взвешенное среднее значение подобранных значений вычисляется как

$\bar{f} = \frac{[\sum_{i = 1}^{n} w_{i}^{e f f} f_{i}]}{\sum_{i = 1}^{n} w_{i}^{e f f}} .$

Типы данных: double

`SST` - Общая сумма квадратов
положительное скалярное значение

Общая сумма квадратов, сохраненная как положительная скалярная величина значение. Для модели GLME, SST определяется как SST = SSE + SSR.

Типы данных: double

`VariableInfo` - Информация о переменных
таблица

Сведения о переменных, используемых в подгонке, хранятся в виде таблицы. VariableInfo имеет по одной строке для каждой переменной и содержит следующие столбцы.

Имя столбца	Описание
`Class`	Класс переменной (`'double'`, `'cell'`, `'nominal'`, и так далее).
`Range`	Область значений значений переменной. Для числовой переменной, `Range` является двухэлементным вектором вида `[min,max]`. Для камеры или категориальной переменной, `Range` - массив ячеек или категориальный массив, содержащий все уникальные значения переменной.
`InModel`	Если переменная является предиктором в подобранной модели, `InModel` является `true`. Если переменная не находится в подобранной модели, `InModel` является `false`.
`IsCategorical`	Если тип переменной рассматривается как категориальный предиктор (такой как камера, логический или категориальный), то `IsCategorical` является `true`. Если переменная является непрерывным предиктором, то `IsCategorical` является `false`.

Типы данных: table

`VariableNames` - Имена переменных
массив ячеек из векторов символов

Имена всех переменных, содержащихся в таблице или массиве набора данных tbl, сохраненный как массив ячеек из векторов символов.

Типы данных: cell

`Variables` - Переменные
таблица

Переменные, хранящиеся в виде таблицы. Если подгонка основана на таблице или массиве набора данных tbl, затем Variables идентичен tbl.

Типы данных: table

Функции объекта

`anova`	Анализ отклонения для обобщенной модели линейных смешанных эффектов
`coefCI`	Доверительные интервалы для коэффициентов обобщенной линейной модели смешанных эффектов
`coefTest`	Тест гипотезы на фиксированных и случайных эффектах обобщенной модели линейных смешанных эффектов
`compare`	Сравнение обобщенных линейных моделей смешанных эффектов
`covarianceParameters`	Извлечение ковариационных параметров обобщенной линейной модели смешанных эффектов
`designMatrix`	Матрицы разработки фиксированных и случайных эффектов
`fitted`	Подгонянные отклики обобщенной модели линейных смешанных эффектов
`fixedEffects`	Оценки фиксированных эффектов и соответствующие статистические данные
`partialDependence`	Вычисление частичной зависимости
`plotPartialDependence`	Создайте график частичной зависимости (PDP) и отдельные графики условного ожидания (ICE)
`plotResiduals`	Постройте графики невязок обобщенной модели линейных смешанных эффектов
`predict`	Предсказать ответ обобщенной модели линейных смешанных эффектов
`random`	Сгенерируйте случайные отклики из подобранной обобщенной линейной модели смешанных эффектов
`randomEffects`	Оценки случайных эффектов и соответствующие статистические данные
`refit`	Обновите обобщенную линейную модель смешанных эффектов
`residuals`	Невязки подобранной обобщенной линейной модели смешанных эффектов
`response`	Вектор отклика обобщенной линейной модели смешанных эффектов

Примеры

свернуть все

Подбор обобщенной линейной модели смешанных эффектов

Открыть Live Script

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

Флаг, указывающий, использовал ли пакет новый процесс (newprocess)
Время вычислений для каждой партии, в часах (time)
Температура партии, в степенях Цельсия (temp)
Категориальная переменная, указывающая на поставщика (A, B, или C) химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите термин случайных эффектов для точки пересечения, сгруппированного по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

${defects}_{i j} \sim Пуассон (μ_{i j})$

Это соответствует обобщенной модели линейных смешанных эффектов

$\log (μ_{i j}) = β_{0} + β_{1} {newprocess}_{i j} + β_{2} {time_dev}_{i j} + β_{3} {temp_dev}_{i j} + β_{4} {supplier_C}_{i j} + β_{5} {supplier_B}_{i j} + b_{i},$

где

${defects}_{i j}$ количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем $i$ во время партии $j$ .
$μ_{i j}$ - среднее количество дефектов, соответствующих заводу $i$ (где $i = 1, 2, . . ., 20$ ) во время партии $j$ (где $j = 1, 2, . . ., 5$ ).
${newprocess}_{i j}$ , ${time_dev}_{i j}$ , и ${temp_dev}_{i j}$ являются измерениями для каждой переменной, которые соответствуют фабрике $i$ во время партии $j$ . Для примера, ${newprocess}_{i j}$ указывает, производится ли партия заводом-изготовителем $i$ во время партии $j$ использовали новый процесс.
${supplier_C}_{i j}$ и ${supplier_B}_{i j}$ являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом $i$ во время партии $j$ .
$b_{i} \sim N (0, σ_{b}^{2})$ является точка пересечения случайных эффектов для каждого завода $i$ который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

Отобразите модель.

disp(glme)

Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1

The Model information таблица отображает общее количество наблюдений в выборочных данных (100), количество коэффициентов фиксированных и случайных эффектов (6 и 20, соответственно) и количество ковариационных параметров (1). Это также указывает, что переменная отклика имеет Poisson распределение, функция ссылки Log, и метод подгонки Laplace.

Formula указывает спецификацию модели, использующую обозначение Уилкинсона.

The Model fit statistics таблица отображает статистику, используемую для оценки качества подгонки модели. Это включает информационный критерий Акаике (AIC), байесовский информационный критерий (BIC) значения, журнал правдоподобия (LogLikelihood), и отклонение (Deviance) значения.

The Fixed effects coefficients таблица указывает, что fitglme возвращено 95% доверительных интервалов. Он содержит одну строку для каждого предиктора фиксированных эффектов, и каждый столбец содержит статистику, соответствующую этому предиктору. Столбец 1 (Name) содержит имя каждого коэффициента с фиксированными эффектами, столбец 2 (Estimate) содержит его расчетное значение и столбец 3 (SE) содержит стандартную ошибку коэффициента. Столбец 4 (tStat) содержит $t$ -statistic для проверки гипотезы, что коэффициент равен 0. Столбец 5 (DF) и столбец 6 (pValue) содержат степени свободы и $p$ -значение, которое соответствует $t$ -статистический, соответственно. Последние два столбца (Lower и Upper) отображать нижний и верхний пределы, соответственно, 95% доверительного интервала для каждого коэффициента фиксированных эффектов.

Random effects covariance parameters отображает таблицу для каждой сгруппированной переменной (только здесь factory), включая его общее количество уровней (20), и тип и оценку ковариационного параметра. Здесь, std указывает, что fitglme возвращает стандартное отклонение случайного эффекта, сопоставленного с заводским предиктором, которое имеет оценочное значение 0,31381. В нем также отображается таблица, содержащая тип параметра ошибки (здесь квадратный корень параметра дисперсии) и его предполагаемое значение 1.

Стандартное отображение, сгенерированный fitglme не предоставляет доверительные интервалы для параметров случайных эффектов. Чтобы вычислить и отобразить эти значения, используйте covarianceParameters.

Подробнее о

расширить все

Формула

В целом формула для спецификации модели является вектором символов или строковым скаляром вида 'y ~ terms'. Для обобщенных линейных моделей смешанных эффектов эта формула находится в форме 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержат элементы с фиксированными эффектами и случайными эффектами, соответственно, и R является количеством сгруппированных переменных в модели.

Предположим, таблица tbl содержит следующее:

Переменная отклика, y
Переменные предиктора, _Xj, которая может быть непрерывной или сгруппированными переменными
Сгруппированные переменные, _g1, _g2..., _gR,

где сгруппированные переменные в _Xj и _gr могут быть категориальными, логическими, символьными массивами, строковыми массивами или массивами ячеек векторов символов.

Затем в формуле формы _{'y ~ fixed + (random1|g1) + ... + (randomR|gR)'}, термин fixed соответствует спецификации матрицы проекта с фиксированными эффектами X, random₁ является спецификацией матрицы проекта случайных эффектов Z₁, соответствующий сгруппированной переменной g₁, и аналогично random_R является спецификацией матрицы проекта случайных эффектов Z_R, соответствующий сгруппированной переменной g_R. Вы можете выразить fixed и random термины, использующие обозначение Уилкинсона.

Уилкинсон обозначения описывает факторы, присутствующие в моделях. Это обозначение относится к факторам, присутствующим в моделях, а не к умножителям (коэффициентам) этих факторов.

Уилкинсон Обозначение	Факторы в стандартном обозначении
`1`	Константа ( точку пересечения) термин
`X^k`, где `k` является положительным целым числом	`X`, `X²`,..., X`^k`
`X1 + X2`	`X1`, `X2`
`X1*X2`	`X1`, `X2`, `X1.*X2 (elementwise multiplication of X1 and X2)`
`X1:X2`	`X1.*X2` только
`- X2`	Не включать `X2`
`X1*X2 + X3`	`X1`, `X2`, `X3`, `X1*X2`
`X1 + X2 + X3 + X1:X2`	`X1`, `X2`, `X3`, `X1*X2`
`X1X2X3 - X1:X2:X3`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`, `X2*X3`
`X1*(X2 + X3)`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`

Statistics and Machine Learning Toolbox™ notation всегда включает в себя постоянный термин, если вы явным образом не удаляете термин с помощью -1. Вот несколько примеров для спецификации линейной модели смешанных эффектов.

Примеры:

Формула	Описание
`'y ~ X1 + X2'`	Фиксированные эффекты для точки пересечения, `X1` и `X2`. Это эквивалентно `'y ~ 1 + X1 + X2'`.
`'y ~ -1 + X1 + X2'`	Никаких точек пересечения и фиксированных эффектов для `X1` и `X2`. Неявный термин точки пересечения подавляется включением `-1`.
`'y ~ 1 + (1 \| g1)'`	Фиксированные эффекты для точки пересечения плюс случайный эффект для точки пересечения для каждого уровня сгруппированной переменной `g1`.
`'y ~ X1 + (1 \| g1)'`	Модель случайной точки пересечения с фиксированным уклоном.
`'y ~ X1 + (X1 \| g1)'`	Случайная точка пересечения и наклон, с возможной корреляцией между ними. Это эквивалентно `'y ~ 1 + X1 + (1 + X1\|g1)'`.
`'y ~ X1 + (1 \| g1) + (-1 + X1 \| g1)'`	Независимые условия случайных эффектов для точки пересечения и наклона.
`'y ~ 1 + (1 \| g1) + (1 \| g2) + (1 \| g1:g2)'`	Модель случайной точки пересечения с независимыми основными эффектами для `g1` и `g2`, плюс независимый эффект взаимодействия.

См. также

fitglme

Документация

GeneralizedLinearMixedModel class

Описание

Конструкция

Входные параметры

tbl - Входные данные таблица | массив набора данных

formula - Формула для спецификации модели вектор символов или строковый скаляр вида 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'

Свойства

Coefficients - Оценки коэффициентов фиксированных эффектов массив набора данных

CoefficientCovariance - Ковариация предполагаемого вектора с фиксированными эффектами матрица

CoefficientNames - Имена коэффициентов с фиксированными эффектами массив ячеек из векторов символов

DFE - Степени свободы для ошибки положительное целое значение

Dispersion - Модель параметра дисперсии скалярное значение

DispersionEstimated - Флаг, указывающий, был ли оценен параметр дисперсии true | false

Distribution - имя распределения отклика 'Normal' | 'Binomial' | 'Poisson' | 'Gamma' | 'InverseGaussian'

FitMethod - Метод, используемый для подгонки модели 'MPL' | 'REMPL' | 'ApproximateLaplace' | 'Laplace'

Formula - Формула спецификации модели объект

Link - Характеристики функции ссылки структура

LogLikelihood - Журнал функции правдоподобия скалярное значение

ModelCriterion - Критерий модели таблица

NumCoefficients - Количество коэффициентов с фиксированными эффектами положительное целое значение

NumEstimatedCoefficients - Количество расчетных коэффициентов фиксированных эффектов положительное целое значение

NumObservations - Количество наблюдений положительное целое значение

NumPredictors - Количество предикторов положительное целое значение

NumVariables - Общее количество переменных положительное целое значение

ObservationInfo - Информация о наблюдениях таблица

ObservationNames - Имена наблюдений массив ячеек из векторов символов

PredictorNames - Имена предикторов массив ячеек из векторов символов

ResponseName - Имя переменной отклика вектор символов

Rsquared - Доля изменчивости в отклике, объясняемая подобранной моделью структура

SSE - Сумма ошибок квадратов положительное скалярное значение

SSR - Регрессионная сумма квадратов положительное скалярное значение

SST - Общая сумма квадратов положительное скалярное значение

VariableInfo - Информация о переменных таблица

VariableNames - Имена переменных массив ячеек из векторов символов

Variables - Переменные таблица

Функции объекта

Примеры

Подбор обобщенной линейной модели смешанных эффектов

Подробнее о

Формула

См. также

Темы

Statistics and Machine Learning Toolbox документация

Поддержка

`tbl` - Входные данные
таблица | массив набора данных

`formula` - Формула для спецификации модели
вектор символов или строковый скаляр вида `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

`Coefficients` - Оценки коэффициентов фиксированных эффектов
массив набора данных

`CoefficientCovariance` - Ковариация предполагаемого вектора с фиксированными эффектами
матрица

`CoefficientNames` - Имена коэффициентов с фиксированными эффектами
массив ячеек из векторов символов

`DFE` - Степени свободы для ошибки
положительное целое значение

`Dispersion` - Модель параметра дисперсии
скалярное значение

`DispersionEstimated` - Флаг, указывающий, был ли оценен параметр дисперсии
`true` | `false`

`Distribution` - имя распределения отклика
`'Normal'` | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

`FitMethod` - Метод, используемый для подгонки модели
`'MPL'` | `'REMPL'` | `'ApproximateLaplace'` | `'Laplace'`

`Formula` - Формула спецификации модели
объект

`Link` - Характеристики функции ссылки
структура

`LogLikelihood` - Журнал функции правдоподобия
скалярное значение

`ModelCriterion` - Критерий модели
таблица

`NumCoefficients` - Количество коэффициентов с фиксированными эффектами
положительное целое значение

`NumEstimatedCoefficients` - Количество расчетных коэффициентов фиксированных эффектов
положительное целое значение

`NumObservations` - Количество наблюдений
положительное целое значение

`NumPredictors` - Количество предикторов
положительное целое значение

`NumVariables` - Общее количество переменных
положительное целое значение

`ObservationInfo` - Информация о наблюдениях
таблица

`ObservationNames` - Имена наблюдений
массив ячеек из векторов символов

`PredictorNames` - Имена предикторов
массив ячеек из векторов символов

`ResponseName` - Имя переменной отклика
вектор символов

`Rsquared` - Доля изменчивости в отклике, объясняемая подобранной моделью
структура

`SSE` - Сумма ошибок квадратов
положительное скалярное значение

`SSR` - Регрессионная сумма квадратов
положительное скалярное значение

`SST` - Общая сумма квадратов
положительное скалярное значение

`VariableInfo` - Информация о переменных
таблица

`VariableNames` - Имена переменных
массив ячеек из векторов символов

`Variables` - Переменные
таблица