fitglme

Подгонка обобщенной линейной модели смешанных эффектов

Описание

пример

glme = fitglme(tbl,formula) возвращает обобщенную линейную модель смешанных эффектов, glme. Модель задается как formula и подобранные к переменным предиктора в таблице или массиве наборов данных, tbl.

glme = fitglme(tbl,formula,Name,Value) возвращает обобщенную линейную модель смешанных эффектов с использованием дополнительных опций, заданных одним или несколькими Name,Value аргументы в виде пар. Для примера можно задать распределение отклика, функции ссылки или ковариации шаблона членов случайных эффектов.

Примеры

свернуть все

Загрузите выборочные данные.

load mfr

Эти моделируемые данные получены от производственной компании, которая управляет 50 заводами по всему миру, причем каждый завод выполняет пакетный процесс для создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих фабрик наугад для участия в эксперименте: Десять фабрик реализовали новый процесс, а другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания запустила пять партий (в общей сложности 100 партий) и записала следующие данные:

  • Флаг, указывающий, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждой партии, в часах (time)

  • Температура партии, в степенях Цельсия (temp)

  • Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)

  • Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, от стандарта процесса в 3 часа при 20 степенях Цельсии.

Подбор обобщенной линейной модели смешанных эффектов с помощью newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включите термин случайных эффектов для точки пересечения, сгруппированного по factory, для расчета различий в качестве, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является логарифмической. Используйте метод Laplace fit, чтобы оценить коэффициенты. Задайте кодировку фиктивной переменной следующим 'effects', поэтому фиктивные переменные коэффициенты равны 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij).

Это соответствует обобщенной модели линейных смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в партии, произведенной заводом-изготовителем i во время партии j.

  • μij - среднее количество дефектов, соответствующих заводу i (где i=1,2,...,20) во время партии j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij являются измерениями для каждой переменной, которые соответствуют фабрике i во время партии j. Для примера, newprocessij указывает, производится ли партия заводом-изготовителем i во время партии j использовали новый процесс.

  • supplier_Cij и supplier_Bij являются фиктивными переменными, которые используют эффекты (сумма к нулю) кодирования, чтобы указать, является ли компания C или B, соответственно, поставила химикаты для партии, произведенной заводом i во время партии j.

  • biN(0,σb2) является точка пересечения случайных эффектов для каждого завода i который учитывает специфические для завода изменения в качестве.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace', ...
    'DummyVarCoding','effects');

Отобразите модель.

disp(glme)
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

The Model information таблица отображает общее количество наблюдений в выборочных данных (100), количество коэффициентов фиксированных и случайных эффектов (6 и 20, соответственно) и количество ковариационных параметров (1). Это также указывает, что переменная отклика имеет Poisson распределение, функция ссылки Log, и метод подгонки Laplace.

Formula указывает спецификацию модели, использующую обозначение Уилкинсона.

The Model fit statistics таблица отображает статистику, используемую для оценки качества подгонки модели. Это включает информационный критерий Акаике (AIC), байесовский информационный критерий (BIC) значения, журнал правдоподобия (LogLikelihood), и отклонение (Deviance) значения.

The Fixed effects coefficients таблица указывает, что fitglme возвращено 95% доверительных интервалов. Он содержит одну строку для каждого предиктора фиксированных эффектов, и каждый столбец содержит статистику, соответствующую этому предиктору. Столбец 1 (Name) содержит имя каждого коэффициента с фиксированными эффектами, столбец 2 (Estimate) содержит его расчетное значение и столбец 3 (SE) содержит стандартную ошибку коэффициента. Столбец 4 (tStat) содержит t-statistic для проверки гипотезы, что коэффициент равен 0. Столбец 5 (DF) и столбец 6 (pValue) содержат степени свободы и p-значение, которое соответствует t-статистический, соответственно. Последние два столбца (Lower и Upper) отображать нижний и верхний пределы, соответственно, 95% доверительного интервала для каждого коэффициента фиксированных эффектов.

Random effects covariance parameters отображает таблицу для каждой сгруппированной переменной (только здесь factory), включая его общее количество уровней (20), и тип и оценку ковариационного параметра. Здесь, std указывает, что fitglme возвращает стандартное отклонение случайного эффекта, сопоставленного с заводским предиктором, которое имеет оценочное значение 0,31381. В нем также отображается таблица, содержащая тип параметра ошибки (здесь квадратный корень параметра дисперсии) и его предполагаемое значение 1.

Стандартное отображение, сгенерированный fitglme не предоставляет доверительные интервалы для параметров случайных эффектов. Чтобы вычислить и отобразить эти значения, используйте covarianceParameters.

Входные параметры

свернуть все

Входные данные, который включает переменную отклика, переменные предиктора и сгруппированные переменные, заданные как таблица или массив набора данных. Переменные предиктора могут быть непрерывными или сгруппированные переменные (см. Сгруппированные переменные). Вы должны задать модель для переменных, используя formula.

Формула для спецификации модели, заданная как вектор символов или строковый скаляр вида 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Формула чувствительна к регистру. Полное описание см. в Формуле.

Пример: 'y ~ treatment + (1|block)'

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects' задает распределение переменной отклика как Пуассон, функцию ссылки как журнал, метод подгонки как Laplace и кодирование фиктивной переменной, где сумма коэффициентов равна 0.

Количество испытаний биномиального распределения, то есть размера выборки, заданное как разделенная запятой пара, состоящее из скалярного значения, вектора той же длины, что и ответ, или имени переменной в вход таблице. Если вы задаете имя переменной, то переменная должна быть той же длины, что и ответ. BinomialSize применяется только тогда, когда Distribution параметр 'binomial'.

Если BinomialSize является скалярным значением, что означает, что все наблюдения имеют одинаковое количество испытаний.

Типы данных: single | double

Индикатор для проверки положительной определенности Гессиана целевой функции относительно неограниченных параметров при сходимости, заданный как разделенная разделенными запятой парами, состоящая из 'CheckHessian' и любой из них false или true. По умолчанию это false.

Задайте 'CheckHessian' как true чтобы проверить оптимальность решения или определить, является ли модель избыточно параметеризированной в количестве ковариационных параметров.

Если вы задаете 'FitMethod' как 'MPL' или 'REMPL'затем ковариация фиксированных эффектов и ковариационных параметров основана на подобранной линейной модели смешанных эффектов от конечной итерации псевдовидучести.

Пример: 'CheckHessian',true

Метод для вычисления ковариации предполагаемых параметров, заданный как разделенная запятыми пара, состоящая из 'CovarianceMethod' и любой из них 'conditional' или 'JointHessian'. Если вы задаете 'conditional', затем fitglme вычисляет быстрое приближение к ковариации фиксированных эффектов с учетом предполагаемых ковариационных параметров. Он не вычисляет ковариацию ковариационных параметров. Если вы задаете 'JointHessian', затем fitglme вычисляет ковариацию фиксированных эффектов и ковариационных параметров в суставах через наблюдаемую информационную матрицу с помощью логарифмической правдоподобности Лапласа.

Если вы задаете 'FitMethod' как 'MPL' или 'REMPL'затем ковариация фиксированных эффектов и ковариационных параметров основана на подобранной линейной модели смешанных эффектов от конечной итерации псевдовидучести.

Пример: 'CovarianceMethod','JointHessian'

Шаблон ковариационной матрицы случайных эффектов, заданный как разделенная разделенными запятой парами, состоящая из 'CovariancePattern' и 'FullCholesky', 'Isotropic', 'Full', 'Diagonal', 'CompSymm', квадратная симметричная логическая матрица, строковые массивы или массив ячеек, содержащий векторы символов или логические матрицы.

Если существует R членов случайных эффектов, то значение 'CovariancePattern' должен быть массивом строк или массивом ячеек с R длины, где каждый r элемента массива задает шаблон ковариационной матрицы вектора случайных эффектов, сопоставленного с r-м термином случайных эффектов. Далее приводятся опции для каждого элемента.

ЗначениеОписание
'FullCholesky'Полная ковариационная матрица с использованием параметризации Холецкого. fitglme оценивает все элементы ковариационной матрицы.
'Isotropic'

Диагональная ковариационная матрица с равными отклонениями. То есть, off-диагональные элементы ковариационной матрицы ограничены, чтобы быть 0, и диагональные элементы ограничены, чтобы быть равными. Например, если существует три условия случайных эффектов с изотропной ковариационной структурой, эта ковариационная матрица выглядит как

(σb2000σb2000σb2)

где21 является общим отклонением членов случайных эффектов.

'Full'Полная ковариационная матрица, с помощью логарифмической параметризации. fitlme оценивает все элементы ковариационной матрицы.
'Diagonal'

Диагональная ковариационная матрица. То есть, off-диагональные элементы ковариационной матрицы ограничены, чтобы быть 0.

(σb12000σb22000σb32)

'CompSymm'

Составная структура симметрии. То есть общее отклонение по диагоналям и равная корреляция между всеми случайными эффектами. Для примера, если существует три условия случайных эффектов с матрицей ковариации, имеющей составную структуру симметрии, эта ковариация матрица выглядит как

(σb12σb1,b2σb1,b2σb1,b2σb12σb1,b2σb1,b2σb1,b2σb12)

где2b1 является общим отклонением членов random-эффектов, а, b1, b2 является общим ковариацией между любыми двумя терминами random-эффектов.

PATКвадратная симметричная логическая матрица. Если 'CovariancePattern' определяется матрицей PAT, и если PAT(a,b) = false, затем (a,b) элемент соответствующей ковариационной матрицы ограничен равным 0.

Для скалярных членов случайных эффектов, по умолчанию является 'Isotropic'. В противном случае значение по умолчанию является 'FullCholesky'.

Пример: 'CovariancePattern','Diagonal'

Пример: 'CovariancePattern',{'Full','Diagonal'}

Типы данных: char | string | logical | cell

Индикатор для вычисления параметра дисперсии для 'binomial' и 'poisson' распределения, заданные как разделенная разделенными запятой парами, состоящая из 'DispersionFlag' и одно из следующих.

ЗначениеОписание
trueОцените параметр дисперсии при вычислении стандартных ошибок
falseИспользуйте теоретическое значение 1.0 при вычислении стандартных ошибок

'DispersionFlag' применяется только в том случае, если 'FitMethod' является 'MPL' или 'REMPL'.

Функция аппроксимации всегда оценивает дисперсию для других распределений.

Пример: 'DispersionFlag',true

Распределение переменной отклика, заданное как разделенная разделенными запятой парами, состоящая из 'Distribution' и одно из следующих.

ЗначениеОписание
'Normal'Нормальное распределение
'Binomial'Биномиальное распределение
'Poisson'Распределение Пуассона
'Gamma'Гамма- распределение
'InverseGaussian'Обратное Гауссово распределение

Пример: 'Distribution','Binomial'

Кодирование для использования с фиктивными переменными, созданными из категориальных переменных, заданное как разделенная разделенными запятой парами, состоящая из 'DummyVarCoding' и одна из переменных в этой таблице.

ЗначениеОписание
'reference' (по умолчанию)fitglme создает фиктивные переменные с группой ссылки. Эта схема рассматривает первую категорию как ссылочную группу и создает на одну меньше фиктивных переменных, чем количество категорий. Порядок категорий категорийной переменной можно проверить при помощи categories function, и изменить порядок при помощи reordercats функция.
'effects'fitglme создает фиктивные переменные, используя кодирование эффектов. Эта схема использует -1, чтобы представлять последнюю категорию. Эта схема создает меньше фиктивных переменных, чем количество категорий.
'full'fitglme создает полные фиктивные переменные. Эта схема создает по одной фиктивной переменной для каждой категории.

Для получения дополнительной информации о создании переменных манекена, смотрите Автоматическое создание переменных манекена.

Пример: 'DummyVarCoding','effects'

Метод, используемый для аппроксимации эмпирических оценок Байеса случайных эффектов, заданных как разделенная запятыми пара, состоящая из 'EBMethod' и одно из следующих.

  • 'Auto'

  • 'LineSearchNewton'

  • 'TrustRegion2D'

  • 'fsolve'

'Auto' аналогичен 'LineSearchNewton' но использует другой критерий сходимости и не отображает итерационный прогресс. 'Auto' и 'LineSearchNewton' возможно сбой для неканонических функций ссылки связи. Для неканонических функций ссылки, 'TrustRegion2D' или 'fsolve' рекомендуемые. Для использования необходимо иметь Optimization Toolbox™ 'fsolve'.

Пример: 'EBMethod','LineSearchNewton'

Опции для эмпирической оптимизации Байеса, заданные как разделенная разделенными запятой парами, состоящая из 'EBOptions' и структуру, содержащую следующее.

ЗначениеОписание
'TolFun'Относительная погрешность по норме градиента. Значение по умолчанию является 1e-6.
'TolX'Абсолютная погрешность по размеру шага. Значение по умолчанию является 1e-8.
'MaxIter'Максимальное количество итераций. Значение по умолчанию является 100.
'Display''off', 'iter', или 'final'. По умолчанию это 'off'.

Если EBMethod является 'Auto' и 'FitMethod' является 'Laplace', TolFun является относительная погрешность на линейном предикторе модели и 'Display' опция не применяется.

Если 'EBMethod' является 'fsolve', затем 'EBOptions' должен быть задан как объект, созданный optimoptions('fsolve').

Типы данных: struct

Индексы для строк, чтобы исключить из обобщенной модели линейных смешанных эффектов в данных, заданные как разделенная разделенными запятой парами, состоящая из 'Exclude' и вектор с целым числом или логическими значениями.

Для примера можно исключить 13-ю и 67-ю строки из подгонки следующим образом.

Пример: 'Exclude',[13,67]

Типы данных: single | double | logical

Метод оценки параметров модели, заданный как разделенная запятыми пара, состоящая из 'FitMethod' и одно из следующих.

  • 'MPL' - Максимальная псевдоправдоподобность

  • 'REMPL' - Ограниченная максимальная псевдоподобность

  • 'Laplace' - Максимальная вероятность с помощью приближения Лапласа

  • 'ApproximateLaplace' - Максимальная правдоподобность с использованием приблизительного приближения Лапласа с профилированными фиксированными эффектами

Пример: 'FitMethod','REMPL'

Начальное количество итераций псевдоправдоподобия, используемых для инициализации параметров для ApproximateLaplace и Laplace методы подгонки, заданные как разделенная разделенными запятой парами, состоящая из 'InitPLIterations' и целое число значения больше или равное 1.

Типы данных: single | double

Начальное значение для условного среднего, заданное как разделенная разделенными запятой парами, состоящая из 'MuStart' и скалярное значение. Допустимые значения:

Распределение откликаДопустимые значения
'Normal'(-Inf,Inf)
'Binomial'(0,1)
'Poisson'(0,Inf)
'Gamma'(0,Inf)
'InverseGaussian'(0,Inf)

Типы данных: single | double

Смещение, заданное как разделенная разделенными запятой парами, состоящая из 'Offset' и вектор n -by-1 скалярных значений, где n - длина вектора отклика. Можно также задать имя переменной вектора n -by-1 скалярных значений. 'Offset' используется как дополнительный предиктор, который имеет фиксированное значение коэффициента 1.0.

Типы данных: single | double

Алгоритм оптимизации, заданный как разделенная разделенными запятой парами, состоящая из 'Optimizer' и любое из следующих.

ЗначениеОписание
'quasinewton'Использует оптимизатор на основе доверительной области квази-Ньютона. Изменить опции алгоритма можно используя statset('fitglme'). Если вы не задаете опции, то fitglme использует опции по умолчанию statset('fitglme').
'fminsearch'Использует метод Нелдера-Мида без производной. Изменить опции алгоритма можно используя optimset('fminsearch'). Если вы не задаете опции, то fitglme использует опции по умолчанию optimset('fminsearch').
'fminunc'Использует метод квази-Ньютона, основанный на поиске линий. Чтобы задать эту опцию, необходимо иметь Optimization Toolbox. Изменить опции алгоритма можно используя optimoptions('fminunc'). Если вы не задаете опции, то fitglme использует опции по умолчанию optimoptions('fminunc') с 'Algorithm' установлено на 'quasi-newton'.

Пример: 'Optimizer','fminsearch'

Опции алгоритма оптимизации, заданные как разделенная разделенными запятой парами, состоящая из 'OptimizerOptions' и структуру, возвращаемую statset('fitglme'), структура, созданная optimset('fminsearch'), или объект, возвращенный optimoptions('fminunc').

  • Если 'Optimizer' является 'fminsearch', затем используйте optimset('fminsearch') для изменения опций алгоритма. Если 'Optimizer' является 'fminsearch' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimset('fminsearch').

  • Если 'Optimizer' является 'fminunc', затем используйте optimoptions('fminunc') для изменения опций алгоритма оптимизации. См. optimoptions для опций 'fminunc' использует. Если 'Optimizer' является 'fminunc' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimoptions('fminunc') с 'Algorithm' установлено на 'quasi-newton'.

  • Если 'Optimizer' является 'quasinewton', затем используйте statset('fitglme') для изменения параметров оптимизации. Если 'Optimizer' является 'quasinewton' и вы не изменяете параметры оптимизации используя statset, затем fitglme использует опции по умолчанию, созданные statset('fitglme').

The 'quasinewton' оптимизатор использует следующие поля в структуре, созданной statset('fitglme').

Относительная погрешность на градиент целевой функции, заданный как положительная скалярная величина значение.

Абсолютная погрешность на размер шага, заданный как положительная скалярная величина значение.

Максимально допустимое количество итераций, заданное как положительная скалярная величина значение.

Level of display, заданный как один из 'off', 'iter', или 'final'.

Максимальное количество итераций псевдоправдоподобия (PL), заданных как разделенная разделенными запятой парами, состоящая из 'PLIterations' и положительное целое значение. PL используется для подбора кривой модели, если 'FitMethod' является 'MPL' или 'REMPL'. Для других 'FitMethod' значения, итерации PL используются для инициализации параметров для последующей оптимизации.

Пример: 'PLIterations',200

Типы данных: single | double

Относительная погрешность для итераций псевдоправдоподобия, заданный как разделенная разделенными запятой парами, состоящая из 'PLTolerance' и положительная скалярная величина значение.

Пример: 'PLTolerance',1e-06

Типы данных: single | double

Метод для запуска итерационной оптимизации, заданный как разделенная разделенными запятой парами, состоящая из 'StartMethod' и любое из следующих.

ЗначениеОписание
'default'Внутренне определенное значение по умолчанию
'random'Случайное начальное значение

Пример: 'StartMethod','random'

, заданная как разделенная разделенными запятой парами, состоящая из 'UseSequentialFitting' и любой из них false или true. Если 'UseSequentialFitting' является falseВсе максимальные методы правдоподобия инициализируются с использованием одной или нескольких итераций псевдоправдоподобия. Если 'UseSequentialFitting' является trueначальные значения из итераций псевдоправдоподобия уточняются с помощью 'ApproximateLaplace' для 'Laplace' подбор кривой.

Пример: 'UseSequentialFitting',true

Индикатор для отображения процесса оптимизации на экране, заданный как разделенная разделенными запятой парами, состоящая из 'Verbose' и 0, 1, или 2. Если 'Verbose' задается как 1 или 2, затем fitglme отображает прогресс итерационного процесса аппроксимации модели. Определение 'Verbose' как 2 отображает итерационную информацию оптимизации из отдельных итераций псевдоправдоподобия. Определение 'Verbose' как 1 опускает это отображение.

Настройка для 'Verbose' переопределяет поле 'Display' в 'OptimizerOptions'.

Пример: 'Verbose',1

Веса наблюдений, заданные как разделенная разделенными запятой парами, состоящая из 'Weights' и вектор n -by-1 неотрицательных скалярных значений, где n - количество наблюдений. Если распределение отклика биномиальное или Пуассон, то 'Weights' должен быть вектором положительных целых чисел.

Типы данных: single | double

Выходные аргументы

свернуть все

Обобщенная модель линейных смешанных эффектов, заданная как GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта смотрите GeneralizedLinearMixedModel.

Подробнее о

свернуть все

Формула

В целом формула для спецификации модели является вектором символов или строковым скаляром вида 'y ~ terms'. Для обобщенных моделей линейных смешанных эффектов эта формула находится в форме 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержат фиксированные эффекты и условия случайных эффектов.

Предположим, таблица tbl содержит следующее:

  • Переменная отклика, y

  • Переменные предиктора, Xj, которая может быть непрерывной или сгруппированными переменными

  • Сгруппированные переменные, g1, g2..., gR,

где сгруппированные переменные в Xj и gr могут быть категориальными, логическими, символьными массивами, строковыми массивами или массивами ячеек векторов символов.

Затем в формуле формы 'y ~ fixed + (random1|g1) + ... + (randomR|gR)', термин fixed соответствует спецификации матрицы проекта с фиксированными эффектами X, random1 является спецификацией матрицы проекта случайных эффектов Z1, соответствующий сгруппированной переменной g1, и аналогично randomR является спецификацией матрицы проекта случайных эффектов ZR, соответствующий сгруппированной переменной gR. Вы можете выразить fixed и random термины, использующие обозначение Уилкинсона.

Уилкинсон обозначения описывает факторы, присутствующие в моделях. Это обозначение относится к факторам, присутствующим в моделях, а не к умножителям (коэффициентам) этих факторов.

Уилкинсон ОбозначениеФакторы в стандартном обозначении
1Константа ( точку пересечения) термин
X^k, где k является положительным целым числомX, X2,..., Xk
X1 + X2X1, X2
X1*X2X1, X2, X1.*X2 (elementwise multiplication of X1 and X2)
X1:X2X1.*X2 только
- X2Не включать X2
X1*X2 + X3X1, X2, X3, X1*X2
X1 + X2 + X3 + X1:X2X1, X2, X3, X1*X2
X1*X2*X3 - X1:X2:X3X1, X2, X3, X1*X2, X1*X3, X2*X3
X1*(X2 + X3)X1, X2, X3, X1*X2, X1*X3

Statistics and Machine Learning Toolbox™ notation всегда включает в себя постоянный термин, если вы явным образом не удаляете термин с помощью -1. Вот несколько примеров для обобщенной спецификации модели линейных смешанных эффектов.

Примеры:

ФормулаОписание
'y ~ X1 + X2'Фиксированные эффекты для точки пересечения, X1 и X2. Это эквивалентно 'y ~ 1 + X1 + X2'.
'y ~ -1 + X1 + X2'Никаких точек пересечения и фиксированных эффектов для X1 и X2. Неявный термин точки пересечения подавляется включением -1.
'y ~ 1 + (1 | g1)'Фиксированные эффекты для точки пересечения плюс случайный эффект для точки пересечения для каждого уровня сгруппированной переменной g1.
'y ~ X1 + (1 | g1)'Модель случайной точки пересечения с фиксированным уклоном.
'y ~ X1 + (X1 | g1)'Случайная точка пересечения и наклон, с возможной корреляцией между ними. Это эквивалентно 'y ~ 1 + X1 + (1 + X1|g1)'.
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' Независимые условия случайных эффектов для точки пересечения и наклона.
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)'Модель случайной точки пересечения с независимыми основными эффектами для g1 и g2, плюс независимый эффект взаимодействия.
Введенный в R2014b