exponenta event banner

fitglme

Подгонка обобщенной линейной модели смешанных эффектов

Описание

пример

glme = fitglme(tbl,formula) возвращает обобщенную линейную модель смешанных эффектов, glme. Модель определяется formula и подгоняют к переменным предиктора в таблице или массиве наборов данных, tbl.

glme = fitglme(tbl,formula,Name,Value) возвращает обобщенную линейную модель смешанных эффектов с использованием дополнительных опций, заданных одним или несколькими Name,Value аргументы пары. Например, можно задать распределение отклика, функции связи или ковариационного шаблона членов случайных эффектов.

Примеры

свернуть все

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовала ли партия новый процесс (newprocess)

  • Время обработки для каждой партии, в часах (time)

  • Температура партии, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

defectsij∼Poisson (мкидж).

Это соответствует обобщенной линейной модели смешанных эффектов

log (micij) = β0 + β1newprocessij + β2time _ devij + β3temp _ devij + β4supplier _ Cij + β5supplier _ Bij + bi,

где

  • defectsij - количество дефектов, наблюдаемых в партии, произведенной заводом i во время партии j.

  • pciij - среднее число дефектов, соответствующих заводу i (где i = 1,2,..., 20) во время партии j (где j = 1,2,..., 5).

  • newprocessij, time_devij и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Например, newprocessij указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом i во время партии j.

  • bi∼N (0, startb2) - перехват случайных эффектов для каждой фабрики i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace', ...
    'DummyVarCoding','effects');

Отображение модели.

disp(glme)
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

Model information таблица отображает общее количество наблюдений в данных выборки (100), количество коэффициентов фиксированных и случайных эффектов (6 и 20 соответственно) и количество параметров ковариации (1). Это также указывает, что переменная ответа имеет Poisson распределение, функция линии связи Log, и метод подгонки Laplace.

Formula указывает спецификацию модели с помощью нотации Уилкинсона.

Model fit statistics В таблице представлены статистические данные, используемые для оценки соответствия модели. Это включает в себя информационный критерий Акаике (AIC), байесовский информационный критерий (BIC) значения, логарифмическое правдоподобие (LogLikelihood) и отклонение (Deviance) значения.

Fixed effects coefficients таблица показывает, что fitglme возвращены 95% доверительные интервалы. Он содержит одну строку для каждого предиктора с фиксированными эффектами, и каждый столбец содержит статистику, соответствующую этому предиктору. Столбец 1 (Name) содержит имя каждого коэффициента с фиксированными эффектами, столбец 2 (Estimate) содержит его оценочное значение и столбец 3 (SE) содержит стандартную ошибку коэффициента. Колонка 4 (tStat) содержит t-статистику для проверки гипотезы, что коэффициент равен 0. Столбец 5 (DF) и колонку 6 (pValue) содержат степени свободы и p-значение, которые соответствуют t-статистике соответственно. Последние два столбца (Lower и Upper) отображать нижний и верхний пределы, соответственно, 95% доверительного интервала для каждого коэффициента с фиксированными эффектами.

Random effects covariance parameters отображает таблицу для каждой переменной группировки (здесь, только factory), включая его общее количество уровней (20), и тип и оценку параметра ковариации. Здесь, std указывает, что fitglme возвращает стандартное отклонение случайного эффекта, связанного с заводским предиктором, которое имеет оценочное значение 0,31381. Также отображается таблица, содержащая тип параметра ошибки (здесь квадратный корень параметра дисперсии) и его оценочное значение 1.

Стандартный экран, созданный fitglme не обеспечивает доверительные интервалы для параметров случайных эффектов. Для вычисления и отображения этих значений используйте covarianceParameters.

Входные аргументы

свернуть все

Входные данные, которые включают переменную ответа, переменные предиктора и переменные группировки, указанные как таблица или массив наборов данных. Переменные предиктора могут быть непрерывными или группирующими переменными (см. Группирование переменных). Необходимо указать модель для переменных с помощью formula.

Формула для спецификации модели, заданная как вектор символа или скаляр строки формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Формула чувствительна к регистру. Полное описание см. в разделе Формула.

Пример: 'y ~ treatment + (1|block)'

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects' задает распределение переменных ответа как Пуассона, функцию связи как log, метод аппроксимации как Лапласа и фиктивное кодирование переменных, где коэффициенты суммируются до 0.

Число испытаний для биномиального распределения, то есть размера выборки, заданного как пара, разделенная запятыми, состоящая из скалярного значения, вектора той же длины, что и отклик, или имени переменной во входной таблице. Если указано имя переменной, она должна иметь ту же длину, что и отклик. BinomialSize применяется только в том случае, если Distribution параметр имеет значение 'binomial'.

Если BinomialSize является скалярным значением, что означает, что все наблюдения имеют одинаковое количество испытаний.

Типы данных: single | double

Индикатор для проверки положительной определённости гессена целевой функции относительно неограниченных параметров при сходимости, определяемой как разделённая запятыми пара, состоящая из 'CheckHessian' и либо false или true. По умолчанию: false.

Определить 'CheckHessian' как true для проверки оптимальности решения или для определения того, является ли модель сверхпараметризованной по количеству параметров ковариации.

При указании 'FitMethod' как 'MPL' или 'REMPL', то ковариация фиксированных эффектов и параметров ковариации основана на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

Пример: 'CheckHessian',true

Метод вычисления ковариации оцениваемых параметров, определяемый как разделенная запятыми пара, состоящая из 'CovarianceMethod' и либо 'conditional' или 'JointHessian'. При указании 'conditional', то fitglme вычисляет быстрое приближение к ковариации фиксированных эффектов, учитывая оцененные параметры ковариации. Она не вычисляет ковариацию параметров ковариации. При указании 'JointHessian', то fitglme вычисляет совместную ковариацию фиксированных эффектов и параметров ковариации через наблюдаемую информационную матрицу, используя лапласовский логарифм.

При указании 'FitMethod' как 'MPL' или 'REMPL', то ковариация фиксированных эффектов и параметров ковариации основана на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

Пример: 'CovarianceMethod','JointHessian'

Шаблон ковариационной матрицы случайных эффектов, определяемый как разделенная запятыми пара, состоящая из 'CovariancePattern' и 'FullCholesky', 'Isotropic', 'Full', 'Diagonal', 'CompSymm', квадратную симметричную логическую матрицу, строковый массив или массив ячеек, содержащий векторы символов или логические матрицы.

Если есть R членов случайных эффектов, то значение 'CovariancePattern' должен быть строковым массивом или массивом ячеек длиной R, где каждый элемент r массива определяет шаблон ковариационной матрицы вектора случайных эффектов, связанного с членом случайных эффектов rth. Ниже приведены опции для каждого элемента.

СтоимостьОписание
'FullCholesky'Полная ковариационная матрица с использованием параметризации Холески. fitglme оценивает все элементы ковариационной матрицы.
'Isotropic'

Диагональная ковариационная матрица с равными дисперсиями. То есть, внедиагональные элементы ковариационной матрицы ограничены равным 0, а диагональные элементы ограничены равным. Например, если существует три члена случайных эффектов с изотропной ковариационной структурой, эта ковариационная матрица выглядит как

(σb2000σb2000σb2)

где start21 - общая дисперсия членов случайных эффектов.

'Full'Полная ковариационная матрица с использованием логарифмической параметризации Холеского. fitlme оценивает все элементы ковариационной матрицы.
'Diagonal'

Диагональная ковариационная матрица. То есть, внедиагональные элементы ковариационной матрицы ограничены 0.

(σb12000σb22000σb32)

'CompSymm'

Составная структура симметрии. То есть общая дисперсия по диагоналям и равная корреляция между всеми случайными эффектами. Например, если есть три члена случайных эффектов с ковариационной матрицей, имеющей структуру составной симметрии, эта ковариационная матрица выглядит как

(σb12σb1, b2σb1, b2σb1, b2σb12σb1, b2σb1, b2σb1, b2σb12)

где start2b1 является общей дисперсией членов случайных эффектов, а startb1, b2 является общей ковариацией между любыми двумя членами случайных эффектов.

PATКвадратно-симметричная логическая матрица. Если 'CovariancePattern' определяется матрицей PAT, и если PAT(a,b) = false, то (a,b) элемент соответствующей ковариационной матрицы ограничен значением 0.

Для скалярных членов случайных эффектов по умолчанию 'Isotropic'. В противном случае значение по умолчанию - 'FullCholesky'.

Пример: 'CovariancePattern','Diagonal'

Пример: 'CovariancePattern',{'Full','Diagonal'}

Типы данных: char | string | logical | cell

Индикатор для вычисления параметра дисперсии 'binomial' и 'poisson' распределения, указанные как пара, разделенная запятыми, состоящая из 'DispersionFlag' и одно из следующих.

СтоимостьОписание
trueОценка параметра дисперсии при вычислении стандартных ошибок
falseИспользовать теоретическое значение 1.0 при вычислении стандартных ошибок

'DispersionFlag' применяется только в том случае, если 'FitMethod' является 'MPL' или 'REMPL'.

Функция аппроксимации всегда оценивает дисперсию для других распределений.

Пример: 'DispersionFlag',true

Распределение переменной ответа, указанной как разделенная запятыми пара, состоящая из 'Distribution' и одно из следующих.

СтоимостьОписание
'Normal'Нормальное распределение
'Binomial'Биномиальное распределение
'Poisson'Распределение Пуассона
'Gamma'Гамма-распределение
'InverseGaussian'Обратное гауссово распределение

Пример: 'Distribution','Binomial'

Кодирование для использования фиктивных переменных, созданных из категориальных переменных, указанных как разделенная запятыми пара, состоящая из 'DummyVarCoding' и одна из переменных в этой таблице.

СтоимостьОписание
'reference' (по умолчанию)fitglme создает фиктивные переменные со ссылочной группой. Эта схема рассматривает первую категорию как группу ссылок и создает на одну фиктивную переменную меньше, чем количество категорий. Можно проверить порядок категорий категориальной переменной с помощью categories и изменить порядок с помощью reordercats функция.
'effects'fitglme создает фиктивные переменные с использованием кодирования эффектов. Эта схема использует -1 для представления последней категории. Эта схема создает на одну фиктивную переменную меньше числа категорий.
'full'fitglme создает полные фиктивные переменные. Эта схема создает одну фиктивную переменную для каждой категории.

Дополнительные сведения о создании фиктивных переменных см. в разделе Автоматическое создание фиктивных переменных.

Пример: 'DummyVarCoding','effects'

Метод, используемый для аппроксимации эмпирических оценок Байеса случайных эффектов, указанных как пара, разделенная запятыми, состоящая из 'EBMethod' и одно из следующих.

  • 'Auto'

  • 'LineSearchNewton'

  • 'TrustRegion2D'

  • 'fsolve'

'Auto' аналогичен 'LineSearchNewton' но использует другой критерий сходимости и не отображает итеративный прогресс. 'Auto' и 'LineSearchNewton' может привести к отказу неканонических функций связи. Для неканонических функций связи, 'TrustRegion2D' или 'fsolve' рекомендуется. Для использования необходимо иметь Toolbox™ оптимизации 'fsolve'.

Пример: 'EBMethod','LineSearchNewton'

Опции эмпирической оптимизации Байеса, указанные как разделенная запятыми пара, состоящая из 'EBOptions' и структуру, содержащую следующее.

СтоимостьОписание
'TolFun'Относительный допуск для градиентной нормы. Значение по умолчанию - 1e-6.
'TolX'Абсолютный допуск по размеру шага. Значение по умолчанию - 1e-8.
'MaxIter'Максимальное число итераций. Значение по умолчанию - 100.
'Display''off', 'iter', или 'final'. По умолчанию: 'off'.

Если EBMethod является 'Auto' и 'FitMethod' является 'Laplace', TolFun - относительный допуск на линейном предикторе модели, и 'Display' параметр не применяется.

Если 'EBMethod' является 'fsolve', то 'EBOptions' должен быть указан как объект, созданный optimoptions('fsolve').

Типы данных: struct

Индексы строк для исключения из обобщенной линейной модели смешанных эффектов в данных, указанной как разделенная запятыми пара, состоящая из 'Exclude' и вектор целых или логических значений.

Например, можно исключить 13-ю и 67-ю строки из посадки следующим образом.

Пример: 'Exclude',[13,67]

Типы данных: single | double | logical

Метод оценки параметров модели, определяемый как разделенная запятыми пара, состоящая из 'FitMethod' и одно из следующих.

  • 'MPL' - Максимальное псевдоправдоподобие

  • 'REMPL' - Ограниченная максимальная псевдопонятность

  • 'Laplace' - Максимальная вероятность с помощью аппроксимации Лапласа

  • 'ApproximateLaplace' - Максимальная вероятность с использованием аппроксимации Лапласа с профилированными фиксированными эффектами

Пример: 'FitMethod','REMPL'

Начальное число псевдо-правдоподобных итераций, использованных для инициализации параметров для ApproximateLaplace и Laplace методы подгонки, указанные как пара, разделенная запятыми, состоящая из 'InitPLIterations' и целое значение, большее или равное 1.

Типы данных: single | double

Начальное значение для условного среднего, указанного как разделенная запятыми пара, состоящая из 'MuStart' и скалярное значение. Допустимые значения:

Распределение ответовДопустимые значения
'Normal'(-Inf,Inf)
'Binomial'(0,1)
'Poisson'(0,Inf)
'Gamma'(0,Inf)
'InverseGaussian'(0,Inf)

Типы данных: single | double

Смещение, указанное как разделенная запятыми пара, состоящая из 'Offset' и вектор n-на-1 скалярных значений, где n - длина вектора отклика. Можно также указать имя переменной вектора скалярных значений n-by-1. 'Offset' используется в качестве дополнительного предиктора, который имеет значение коэффициента, фиксированное на 1.0.

Типы данных: single | double

Алгоритм оптимизации, указанный как пара, разделенная запятыми, состоящая из 'Optimizer' и любое из следующего.

СтоимостьОписание
'quasinewton'Использует квазиньютоновский оптимизатор на основе области доверия. Изменить параметры алгоритма можно с помощью statset('fitglme'). Если параметры не указаны, то fitglme использует опции по умолчанию statset('fitglme').
'fminsearch'Использует метод Нелдера-Мид без производных. Изменить параметры алгоритма можно с помощью optimset('fminsearch'). Если параметры не указаны, то fitglme использует опции по умолчанию optimset('fminsearch').
'fminunc'Использует метод квази-Ньютона на основе поиска строк. Чтобы задать этот параметр, необходимо иметь панель инструментов оптимизации. Изменить параметры алгоритма можно с помощью optimoptions('fminunc'). Если параметры не указаны, то fitglme использует опции по умолчанию optimoptions('fminunc') с 'Algorithm' установить в значение 'quasi-newton'.

Пример: 'Optimizer','fminsearch'

Опции алгоритма оптимизации, указанные как разделенная запятыми пара, состоящая из 'OptimizerOptions' и структура, возвращенная statset('fitglme'), структура, созданная optimset('fminsearch')или объект, возвращенный optimoptions('fminunc').

  • Если 'Optimizer' является 'fminsearch', затем использовать optimset('fminsearch') для изменения параметров алгоритма. Если 'Optimizer' является 'fminsearch' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimset('fminsearch').

  • Если 'Optimizer' является 'fminunc', затем использовать optimoptions('fminunc') для изменения параметров алгоритма оптимизации. Посмотрите optimoptions для опций 'fminunc' использует. Если 'Optimizer' является 'fminunc' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimoptions('fminunc') с 'Algorithm' установить в значение 'quasi-newton'.

  • Если 'Optimizer' является 'quasinewton', затем использовать statset('fitglme') для изменения параметров оптимизации. Если 'Optimizer' является 'quasinewton' и вы не изменяете параметры оптимизации с помощью statset, то fitglme использует параметры по умолчанию, созданные statset('fitglme').

'quasinewton' оптимизатор использует следующие поля в структуре, созданной statset('fitglme').

Относительный допуск для градиента целевой функции, определяемый как положительное скалярное значение.

Абсолютный допуск для размера шага, заданный как положительное скалярное значение.

Максимально допустимое число итераций, указанное как положительное скалярное значение.

Уровень отображения, указанный как один из 'off', 'iter', или 'final'.

Максимальное число итераций псевдоправдоподобия (PL), указанное как пара, разделенная запятыми, состоящая из 'PLIterations' и положительное целое значение. PL используется для подгонки модели, если 'FitMethod' является 'MPL' или 'REMPL'. Для других 'FitMethod' значения, итерации PL используются для инициализации параметров для последующей оптимизации.

Пример: 'PLIterations',200

Типы данных: single | double

Коэффициент относительного допуска для псевдо-правдоподобных итераций, указанный как пара, разделенная запятыми, состоящая из 'PLTolerance' и положительное скалярное значение.

Пример: 'PLTolerance',1e-06

Типы данных: single | double

Метод запуска итеративной оптимизации, указанный как разделенная запятыми пара, состоящая из 'StartMethod' и любое из следующего.

СтоимостьОписание
'default'Внутреннее значение по умолчанию
'random'Случайное начальное значение

Пример: 'StartMethod','random'

, указанная как пара, разделенная запятыми, состоящая из 'UseSequentialFitting' и либо false или true. Если 'UseSequentialFitting' является false, все методы максимального правдоподобия инициализируются с использованием одной или более псевдопонятных итераций правдоподобия. Если 'UseSequentialFitting' является true, исходные значения из псевдо правдоподобных итераций уточняются с использованием 'ApproximateLaplace' для 'Laplace' фитинг.

Пример: 'UseSequentialFitting',true

Индикатор для отображения процесса оптимизации на экране, указанный как разделенная запятыми пара, состоящая из 'Verbose' и 0, 1, или 2. Если 'Verbose' указывается как 1 или 2, то fitglme отображает ход итеративного процесса подгонки модели. Определение 'Verbose' как 2 отображает информацию итеративной оптимизации из отдельных псевдопонятных итераций. Определение 'Verbose' как 1 пропускает этот дисплей.

Настройка для 'Verbose' переопределяет поле 'Display' в 'OptimizerOptions'.

Пример: 'Verbose',1

Веса наблюдения, указанные как разделенная запятыми пара, состоящая из 'Weights' и вектор n-by-1 неотрицательных скалярных значений, где n - число наблюдений. Если распределение ответа биномиальное или Пуассона, то 'Weights' должен быть вектором положительных целых чисел.

Типы данных: single | double

Выходные аргументы

свернуть все

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Подробнее

свернуть все

Формула

В общем случае формула для спецификации модели - это вектор символов или строковый скаляр вида 'y ~ terms'. Для обобщенных линейных моделей смешанных эффектов эта формула имеет вид 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержат фиксированные эффекты и случайные эффекты.

Предположим, таблица tbl содержит:

  • Переменная ответа, y

  • Переменные предиктора, Xj, которые могут быть непрерывными или группирующими переменными

  • Группирование переменных, g1, g2, ..., gR,

где переменные группирования в Xj и gr могут быть категориальными, логическими, символьными массивами, строковыми массивами или массивами ячеек символьных векторов.

Затем, в формуле вида, 'y ~ fixed + (random1|g1) + ... + (randomR|gR)', термин fixed соответствует спецификации матрицы проектирования с фиксированными эффектами X, random1 - спецификация матрицы проектирования случайных эффектов Z1, соответствующий переменной группировки g1, и аналогично randomR - спецификация матрицы проектирования случайных эффектов. ZR соответствует переменной группировки gR. Вы можете выразить fixed и random термины, использующие нотацию Уилкинсона.

Нотация Уилкинсона описывает факторы, присутствующие в моделях. Обозначение относится к факторам, присутствующим в моделях, а не к множителям (коэффициентам) этих факторов.

Нотация УилкинсонаКоэффициенты в стандартной нотации
1Член константы (перехвата)
X^k, где k является положительным целым числомX, X2, ..., Xk
X1 + X2X1, X2
X1*X2X1, X2, X1.*X2 (elementwise multiplication of X1 and X2)
X1:X2X1.*X2 только
- X2Не включать X2
X1*X2 + X3X1, X2, X3, X1*X2
X1 + X2 + X3 + X1:X2X1, X2, X3, X1*X2
X1*X2*X3 - X1:X2:X3X1, X2, X3, X1*X2, X1*X3, X2*X3
X1*(X2 + X3)X1, X2, X3, X1*X2, X1*X3

В нотации Statistics and Machine Learning Toolbox™ всегда содержится постоянный термин, если вы явно не удалили термин с помощью -1. Вот несколько примеров для обобщенной линейной спецификации модели смешанных эффектов.

Примеры:

ФормулаОписание
'y ~ X1 + X2'Фиксированные эффекты для перехвата, X1 и X2. Это эквивалентно 'y ~ 1 + X1 + X2'.
'y ~ -1 + X1 + X2'Отсутствие перехвата и фиксированных эффектов для X1 и X2. Неявный член перехвата подавляется включением -1.
'y ~ 1 + (1 | g1)'Фиксированные эффекты для перехвата плюс случайный эффект для перехвата для каждого уровня переменной группировки g1.
'y ~ X1 + (1 | g1)'Модель случайного пересечения с фиксированным наклоном.
'y ~ X1 + (X1 | g1)'Случайный перехват и наклон, с возможной корреляцией между ними. Это эквивалентно 'y ~ 1 + X1 + (1 + X1|g1)'.
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' Независимые термины случайных эффектов для перехвата и наклона.
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)'Модель случайного перехвата с независимыми основными эффектами для g1 и g2плюс независимый эффект взаимодействия.
Представлен в R2014b