fitglme

Подбирайте обобщенную линейную модель смешанных эффектов

Описание

пример

glme = fitglme(tbl,formula) возвращает обобщенную линейную модель смешанных эффектов, glme. Модель задана formula и адаптированный к переменным предикторам в таблице или массиве набора данных, tbl.

glme = fitglme(tbl,formula,Name,Value) возвращает обобщенную линейную модель смешанных эффектов, использующую дополнительные опции, заданные одним или несколькими Name,Value парные аргументы. Например, можно задать распределение ответа, функции ссылки или шаблона ковариации терминов случайных эффектов.

Примеры

свернуть все

Загрузите выборочные данные.

load mfr

Эти симулированные данные от компании-производителя, которая управляет 50 фабриками во всем мире с каждой фабрикой, запускающей процесс пакетной обработки, чтобы создать готовое изделие. Компания хочет сократить число дефектов в каждом пакете, таким образом, это разработало новый производственный процесс. Чтобы протестировать эффективность нового процесса, компания выбрала 20 своих фабрик наугад, чтобы участвовать в эксперименте: Десять фабрик реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждой из этих 20 фабрик компания запустила пять пакетов (для в общей сложности 100 пакетов) и записала следующие данные:

  • Отметьте, чтобы указать, использовал ли пакет новый процесс (newprocess)

  • Время вычислений для каждого пакета, в часах (time)

  • Температура пакета, в градусах Цельсия (temp)

  • Категориальная переменная, указывающая на поставщика химиката, используемого в пакете (supplier)

  • Количество дефектов в пакете (defects)

Данные также включают time_dev и temp_dev, которые представляют абсолютное отклонение времени и температуры, соответственно, из стандарта процесса 3 часов на уровне 20 градусов Цельсия.

Подбирайте обобщенную линейную модель смешанных эффектов использование newprocess, time_dev, temp_dev, и supplier как предикторы фиксированных эффектов. Включайте термин случайных эффектов для точки пересечения, сгруппированной factory, с учетом качественных различий, которые могут существовать из-за специфичных для фабрики изменений. Переменная отклика defects имеет распределение Пуассона, и соответствующая функция ссылки для этой модели является журналом. Используйте подходящий метод Лапласа, чтобы оценить коэффициенты. Задайте фиктивную переменную, кодирующую как 'effects', таким образом, фиктивные переменные коэффициенты суммируют к 0.

Количество дефектов может быть смоделировано с помощью распределения Пуассона

defectsijПуассон(μij).

Это соответствует обобщенной линейной модели смешанных эффектов

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

где

  • defectsij количество дефектов, наблюдаемых в пакете, произведенном фабрикой i во время пакета j.

  • μij среднее количество дефектов, соответствующих фабрике i (где i=1,2,...,20) во время пакета j (где j=1,2,...,5).

  • newprocessij, time_devij, и temp_devij измерения для каждой переменной, которые соответствуют фабрике i во время пакета j. Например, newprocessij указывает ли пакет, произведенный фабрикой i во время пакета j используемый новый процесс.

  • supplier_Cij и supplier_Bij фиктивные переменные, которые используют эффекты (сумма к нулю) кодирование, чтобы указать ли компания C или B, соответственно, предоставленный химикаты процесса для пакета производятся фабрикой i во время пакета j.

  • biN(0,σb2) точка пересечения случайных эффектов для каждой фабрики i это составляет специфичное для фабрики изменение по качеству.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace', ...
    'DummyVarCoding','effects');

Отобразите модель.

disp(glme)
Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1       

Model information таблица показывает общее количество наблюдений в выборочных данных (100), количество фиксированных - и коэффициенты случайных эффектов (6 и 20, соответственно), и количество параметров ковариации (1). Это также указывает, что переменная отклика имеет Poisson распределение, функцией ссылки является Log, и подходящим методом является Laplace.

Formula указывает на спецификацию модели с помощью обозначения Уилкинсона.

Model fit statistics табличная статистика отображений раньше оценивала качество подгонки модели. Это включает критерий информации о Akaike (AIC), Байесов информационный критерий (BIC) значения, логарифмическая вероятность (LogLikelihood), и отклонение (DevianceЗначения.

Fixed effects coefficients таблица показывает тот fitglme возвращенные 95% доверительных интервалов. Это содержит одну строку для каждого предиктора фиксированных эффектов, и каждый столбец содержит статистику, соответствующую тому предиктору. Столбец 1 (Name) содержит имя каждого коэффициента фиксированных эффектов, столбец 2 (Estimate) содержит его ориентировочную стоимость и столбец 3 (SE) содержит стандартную погрешность коэффициента. Столбец 4 (tStat) содержит t- статистическая величина для теста гипотезы, что коэффициент равен 0. Столбец 5 (DF) и столбец 6 (pValue) содержите степени свободы и p- значение, которые соответствуют t- статистическая величина, соответственно. Последние два столбца (Lower и Upper) отобразите нижние и верхние пределы, соответственно, 95%-го доверительного интервала для каждого коэффициента фиксированных эффектов.

Random effects covariance parameters отображает таблицу для каждой сгруппированной переменной (здесь, только factory), включая его общее количество уровней (20), и тип и оценка параметра ковариации. Здесь, std указывает на тот fitglme возвращает стандартное отклонение случайного эффекта, сопоставленного с предиктором фабрики, который имеет ориентировочную стоимость 0,31381. Это также отображает таблицу, содержащую тип параметра ошибок (здесь, квадратный корень из дисперсионного параметра), и его ориентировочная стоимость 1.

Стандартное отображение сгенерировано fitglme не обеспечивает доверительные интервалы для параметров случайных эффектов. Чтобы вычислить и отобразить эти значения, используйте covarianceParameters.

Входные параметры

свернуть все

Входные данные, который включает переменную отклика, переменные предикторы и сгруппированные переменные в виде массива набора данных или таблицы. Переменные предикторы могут быть непрерывными или сгруппированные переменные (см. Сгруппированные переменные). Необходимо задать модель для переменных с помощью formula.

Формула для спецификации модели в виде вектора символов или строкового скаляра формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Формула является чувствительной к регистру. Для полного описания смотрите Формулу.

Пример: 'y ~ treatment + (1|block)'

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects' задает распределение переменной отклика как Пуассона, функцию ссылки как журнал, подходящий метод как Лаплас и фиктивное кодирование переменной, где коэффициенты суммируют к 0.

Количество испытаний за биномиальное распределение, которое является объемом выборки в виде разделенной запятой пары, состоящей из скалярного значения, вектор из той же длины как ответ или имя переменной во входной таблице. Если вы задаете имя переменной, то переменная должна иметь ту же длину как ответ. BinomialSize применяется только когда Distribution параметром является 'binomial'.

Если BinomialSize скалярное значение, которое означает, что все наблюдения имеют то же количество испытаний.

Типы данных: single | double

Индикатор, чтобы проверять положительную определенность Гессиана целевой функции относительно неограниченных параметров в сходимости в виде разделенной запятой пары, состоящей из 'CheckHessian' и любой false или true. Значением по умолчанию является false.

Задайте 'CheckHessian' как true проверить оптимальность решения или определить, сверхпараметрируется ли модель в количестве параметров ковариации.

Если вы задаете 'FitMethod' как 'MPL' или 'REMPL', затем ковариация фиксированных эффектов и параметров ковариации основана на подбиравшей линейной модели смешанных эффектов от итоговой псевдо итерации вероятности.

Пример: 'CheckHessian',true

Метод, чтобы вычислить ковариацию предполагаемых параметров в виде разделенной запятой пары, состоящей из 'CovarianceMethod' и любой 'conditional' или 'JointHessian'. Если вы задаете 'conditional'то fitglme вычисляет быстрое приближение к ковариации фиксированных эффектов, учитывая предполагаемые параметры ковариации. Это не вычисляет ковариацию параметров ковариации. Если вы задаете 'JointHessian'то fitglme вычисляет объединенную ковариацию фиксированных эффектов и параметров ковариации через наблюдаемую информационную матрицу использование Лапласовой логарифмической правдоподобности.

Если вы задаете 'FitMethod' как 'MPL' или 'REMPL', затем ковариация фиксированных эффектов и параметров ковариации основана на подбиравшей линейной модели смешанных эффектов от итоговой псевдо итерации вероятности.

Пример: 'CovarianceMethod','JointHessian'

Шаблон ковариационной матрицы случайных эффектов в виде разделенной запятой пары, состоящей из 'CovariancePattern' и 'FullCholesky', 'Isotropic'полный, 'Diagonal', 'CompSymm', квадратная симметричная логическая матрица, массив строк или массив ячеек, содержащий векторы символов или логические матрицы.

Если существуют термины случайных эффектов R, то значение 'CovariancePattern' должен быть массив строк или массив ячеек длины R, где каждый элемент r массива задает шаблон ковариационной матрицы вектора случайных эффектов, сопоставленного с r th термин случайных эффектов. Опции для каждого элемента следуют.

ЗначениеОписание
'FullCholesky'Полная ковариационная матрица с помощью параметризации Холесского. fitglme оценки все элементы ковариационной матрицы.
'Isotropic'

Диагональная ковариационная матрица с равными отклонениями. Таким образом, недиагональные элементы ковариационной матрицы ограничиваются быть 0, и диагональные элементы ограничиваются быть равными. Например, если существует три термина случайных эффектов с изотропной структурой ковариации, эта ковариационная матрица похожа

(σb2000σb2000σb2)

где σ21 общее отклонение терминов случайных эффектов.

'Full'Полная ковариационная матрица, с помощью параметризации логарифмического Холесского. fitlme оценки все элементы ковариационной матрицы.
'Diagonal'

Диагональная ковариационная матрица. Таким образом, недиагональные элементы ковариационной матрицы ограничиваются быть 0.

(σb12000σb22000σb32)

'CompSymm'

Составная структура симметрии. Таким образом, общее отклонение по диагоналям и равной корреляции между всеми случайными эффектами. Например, если существует три термина случайных эффектов с ковариационной матрицей, имеющей составную структуру симметрии, эта ковариационная матрица похожа

(σb12σb1,b2σb1,b2σb1,b2σb12σb1,b2σb1,b2σb1,b2σb12)

где σ2b1 является общим отклонением терминов случайных эффектов, и σb1, b2 является общей ковариацией между любыми двумя терминами случайных эффектов.

PATКвадратная симметричная логическая матрица. Если 'CovariancePattern' задан матричным PAT, и если PAT(a,b) = false, затем (a,b) элемент соответствующей ковариационной матрицы ограничивается быть 0.

Для скалярных терминов случайных эффектов значением по умолчанию является 'Isotropic'. В противном случае значением по умолчанию является 'FullCholesky'.

Пример: 'CovariancePattern','Diagonal'

Пример: 'CovariancePattern',{'Full','Diagonal'}

Типы данных: char | string | logical | cell

Индикатор, чтобы вычислить дисперсионный параметр для 'binomial' и 'poisson' распределения в виде разделенной запятой пары, состоящей из 'DispersionFlag' и одно из следующих.

ЗначениеОписание
trueОцените дисперсионный параметр при вычислении стандартных погрешностей
falseИспользуйте теоретическое значение 1.0 при вычислении стандартных погрешностей

'DispersionFlag' только применяется если 'FitMethod' 'MPL' или 'REMPL'.

Подходящая функция всегда оценивает дисперсию для других распределений.

Пример: 'DispersionFlag',true

Распределение переменной отклика в виде разделенной запятой пары, состоящей из 'Distribution' и одно из следующих.

ЗначениеОписание
'Normal'Нормальное распределение
'Binomial'Биномиальное распределение
'Poisson'Распределение Пуассона
'Gamma'Гамма распределение
'InverseGaussian'Обратное Распределение Гаусса

Пример: 'Distribution','Binomial'

Кодирование, чтобы использовать для фиктивных переменных, созданных из категориальных переменных в виде разделенной запятой пары, состоящей из 'DummyVarCoding' и одна из переменных в этой таблице.

ЗначениеОписание
'reference' (значение по умолчанию)fitglme создает фиктивные переменные со ссылочной группой. Эта схема обрабатывает первую категорию как ссылочную группу и создает ту меньше фиктивных переменных, чем количество категорий. Можно проверять порядок категории категориальной переменной при помощи categories функция и изменение порядок при помощи reordercats функция.
'effects'fitglme создает фиктивные переменные с помощью кодирования эффектов. Эта схема использует –1, чтобы представлять последнюю категорию. Эта схема создает тот меньше фиктивных переменных, чем количество категорий.
'full'fitglme создает полные фиктивные переменные. Эта схема создает одну фиктивную переменную для каждой категории.

Для получения дополнительной информации о создании фиктивных переменных, смотрите Автоматическое Создание Фиктивных Переменных.

Пример: 'DummyVarCoding','effects'

Метод раньше аппроксимировал эмпирические оценки Бейеса случайных эффектов в виде разделенной запятой пары, состоящей из 'EBMethod' и одно из следующих.

  • 'Auto'

  • 'LineSearchNewton'

  • 'TrustRegion2D'

  • 'fsolve'

'Auto' похоже на 'LineSearchNewton' но использует различный критерий сходимости и не отображает итеративный прогресс. 'Auto' и 'LineSearchNewton' может перестать работать для неканонических функций ссылки. Для неканонических функций ссылки, 'TrustRegion2D' или 'fsolve' рекомендуются. У вас должен быть Optimization Toolbox™, чтобы использовать 'fsolve'.

Пример: 'EBMethod','LineSearchNewton'

Опции для эмпирической оптимизации Бейеса в виде разделенной запятой пары, состоящей из 'EBOptions' и структура, содержащая следующее.

ЗначениеОписание
'TolFun'Относительная погрешность на норме градиента. Значением по умолчанию является 1e-6.
'TolX'Абсолютная погрешность на размере шага. Значением по умолчанию является 1e-8.
'MaxIter'Максимальное количество итераций. Значение по умолчанию равняется 100.
'Display''off', 'iter', или 'final'. Значением по умолчанию является 'off'.

Если EBMethod 'Auto' и 'FitMethod' 'Laplace', TolFun относительная погрешность на линейном предикторе модели и 'Display' опция не применяется.

Если 'EBMethod' 'fsolve', затем 'EBOptions' должен быть задан как объект, созданный optimoptions('fsolve').

Типы данных: struct

Индексы для строк, чтобы исключить из обобщенной линейной модели смешанных эффектов в данных в виде разделенной запятой пары, состоящей из 'Exclude' и вектор из целочисленных или логических значений.

Например, можно исключить 13-е и 67-е строки из подгонки можно следующим образом.

Пример: 'Exclude',[13,67]

Типы данных: single | double | logical

Метод для оценки параметров модели в виде разделенной запятой пары, состоящей из 'FitMethod' и одно из следующих.

  • 'MPL' — Максимальная псевдо вероятность

  • 'REMPL' — Ограниченная максимальная псевдо вероятность

  • 'Laplace' — Наибольшее правдоподобие с помощью приближения Лапласа

  • 'ApproximateLaplace' — Наибольшее правдоподобие с помощью аппроксимированного приближения Лапласа с фиксированными эффектами, профилируемыми

Пример: 'FitMethod','REMPL'

Начальное количество псевдо итераций вероятности раньше инициализировало параметры для ApproximateLaplace и Laplace подходящие методы в виде разделенной запятой пары, состоящей из 'InitPLIterations' и целочисленное значение, больше, чем или равный 1.

Типы данных: single | double

Начальное значение для условного среднего значения в виде разделенной запятой пары, состоящей из 'MuStart' и скалярное значение. Допустимые значения следующие.

Распределение ответаДопустимые значения
'Normal'(-Inf,Inf)
'Binomial'(0,1)
'Poisson'(0,Inf)
'Gamma'(0,Inf)
'InverseGaussian'(0,Inf)

Типы данных: single | double

Возместите в виде разделенной запятой пары, состоящей из 'Offset' и n-by-1 вектор из скалярных значений, где n является длиной вектора отклика. Можно также задать имя переменной n-by-1 вектор из скалярных значений. 'Offset' используется в качестве дополнительного предиктора, которому зафиксировали содействующее значение в 1.0.

Типы данных: single | double

Алгоритм оптимизации в виде разделенной запятой пары, состоящей из 'Optimizer' и любое из следующих.

ЗначениеОписание
'quasinewton'Использует доверительный находящийся в области оптимизатор квазиньютона. Можно изменить опции алгоритма с помощью statset('fitglme'). Если вы не задаете опции, то fitglme использует опции по умолчанию statset('fitglme').
'fminsearch'Использует метод Nelder-меда без производных. Можно изменить опции алгоритма с помощью optimset('fminsearch'). Если вы не задаете опции, то fitglme использует опции по умолчанию optimset('fminsearch').
'fminunc'Использует линию основанный на поиске приближенный метод ньютона. У вас должен быть Optimization Toolbox, чтобы задать эту опцию. Можно изменить опции алгоритма с помощью optimoptions('fminunc'). Если вы не задаете опции, то fitglme использует опции по умолчанию optimoptions('fminunc') с 'Algorithm' установите на 'quasi-newton'.

Пример: 'Optimizer','fminsearch'

Опции для алгоритма оптимизации в виде разделенной запятой пары, состоящей из 'OptimizerOptions' и структура, возвращенная statset('fitglme'), структура создается optimset('fminsearch'), или объект, возвращенный optimoptions('fminunc').

  • Если 'Optimizer' 'fminsearch', затем используйте optimset('fminsearch') изменить опции алгоритма. Если 'Optimizer' 'fminsearch' и вы не предоставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme опции по умолчанию, созданные optimset('fminsearch').

  • Если 'Optimizer' 'fminunc', затем используйте optimoptions('fminunc') изменить опции алгоритма оптимизации. Смотрите optimoptions для опций 'fminunc' использование. Если 'Optimizer' 'fminunc' и вы не предоставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme опции по умолчанию, созданные optimoptions('fminunc') с 'Algorithm' установите на 'quasi-newton'.

  • Если 'Optimizer' 'quasinewton', затем используйте statset('fitglme') изменить параметры оптимизации. Если 'Optimizer' 'quasinewton' и вы не изменяете использование параметров оптимизации statsetто fitglme использует опции по умолчанию, созданные statset('fitglme').

'quasinewton' оптимизатор использует следующие поля в структуре, созданной statset('fitglme').

Относительная погрешность на градиенте целевой функции в виде значения положительной скалярной величины.

Абсолютная погрешность на размере шага в виде значения положительной скалярной величины.

Максимальное количество итераций позволено в виде значения положительной скалярной величины.

Level of display в виде одного из 'off', 'iter', или 'final'.

Максимальное количество итераций псевдо вероятности (PL) в виде разделенной запятой пары, состоящей из 'PLIterations' и положительное целочисленное значение. PL используется для того, чтобы подбирать модель если 'FitMethod' 'MPL' или 'REMPL'. Для другого 'FitMethod' значения, итерации PL используются, чтобы инициализировать параметры для последующей оптимизации.

Пример: 'PLIterations',200

Типы данных: single | double

Фактор относительной погрешности для псевдо итераций вероятности в виде разделенной запятой пары, состоящей из 'PLTolerance' и значение положительной скалярной величины.

Пример: 'PLTolerance',1e-06

Типы данных: single | double

Метод, чтобы запустить итеративную оптимизацию в виде разделенной запятой пары, состоящей из 'StartMethod' и любое из следующих.

ЗначениеОписание
'default'Внутренне заданное значение по умолчанию
'random'Случайное начальное значение

Пример: 'StartMethod','random'

В виде разделенной запятой пары, состоящей из 'UseSequentialFitting' и любой false или true. Если 'UseSequentialFitting' false, все методы максимального правдоподобия инициализируются с помощью одной или нескольких псевдо итераций вероятности. Если 'UseSequentialFitting' true, начальные значения от псевдо итераций вероятности усовершенствованы с помощью 'ApproximateLaplace' для 'Laplace' подбор кривой.

Пример: 'UseSequentialFitting',true

Индикатор, чтобы отобразить процесс оптимизации на экране в виде разделенной запятой пары, состоящей из 'Verbose' и 0, 1, или 2. Если 'Verbose' задан как 1 или 2то fitglme отображает прогресс итеративного процесса модели подходящего. Определение 'Verbose' как 2 отображает итеративную информацию об оптимизации от отдельных псевдо итераций вероятности. Определение 'Verbose' как 1 не использует это отображение.

Установка для 'Verbose' заменяет поле 'Display' в 'OptimizerOptions'.

Пример: 'Verbose',1

Веса наблюдения в виде разделенной запятой пары, состоящей из 'Weights' и n-by-1 вектор из неотрицательных скалярных значений, где n является количеством наблюдений. Если распределение ответа является биномом или Пуассоном, то 'Weights' должен быть вектор из положительных целых чисел.

Типы данных: single | double

Выходные аргументы

свернуть все

Обобщенная линейная модель смешанных эффектов в виде GeneralizedLinearMixedModel объект. Для свойств и методов этого объекта, смотрите GeneralizedLinearMixedModel.

Больше о

свернуть все

Формула

В общем случае формула для спецификации модели является вектором символов или строковым скаляром формы 'y ~ terms'. Для обобщенных линейных моделей смешанных эффектов эта формула находится в форме 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержите фиксированные эффекты и термины случайных эффектов.

Предположим таблица tbl содержит следующее:

  • Переменная отклика, y

  • Переменные предикторы, Xj, который может быть непрерывным или сгруппированные переменные

  • Сгруппированные переменные, g1, g2..., gR,

где сгруппированные переменные в Xj и gr может быть категориальным, логическим, символьные массивы, строковые массивы или массивы ячеек из символьных векторов.

Затем в формуле формы, 'y ~ fixed + (random1|g1) + ... + (randomR|gR)', термин fixed соответствует спецификации проекта фиксированных эффектов матричный X, random1 спецификация проекта случайных эффектов матричный Z1 соответствие сгруппированной переменной g1, и так же randomR является спецификацией проекта случайных эффектов матричный ZR, соответствующий сгруппированной переменной gR. Можно описать fixed и random термины с помощью обозначения Уилкинсона.

Обозначение Уилкинсона описывает факторы, существующие в моделях. Обозначение относится к факторам, существующим в моделях, не ко множителям (коэффициенты) тех факторов.

Обозначение УилкинсонаВключает стандартное обозначение
1Постоянный (точка пересечения) термин
X^k, где k положительное целое числоXX2Xk
X1 + X2X1x2
X1*X2X1x2 , X1.*X2 (elementwise multiplication of X1 and X2)
X1:X2X1.*X2 только
- X2Не включайте X2
X1*X2 + X3X1x2 , X3x1, x2
X1 + X2 + X3 + X1:X2X1x2 , X3x1, x2
X1*X2*X3 - X1:X2:X3X1x2 , X3x1, x2 , X1*X3, X2*X3
X1*(X2 + X3)X1x2 , X3x1, x2 , X1*X3

Обозначение Statistics and Machine Learning Toolbox™ всегда включает постоянный термин, если вы явным образом не удаляете термин с помощью -1. Вот некоторые примеры для обобщенной линейной спецификации модели смешанных эффектов.

Примеры:

ФормулаОписание
'y ~ X1 + X2'Фиксированные эффекты для точки пересечения, X1 и X2. Это эквивалентно 'y ~ 1 + X1 + X2'.
'y ~ -1 + X1 + X2'Никакая точка пересечения и зафиксированные эффекты для X1 и X2. Неявный термин точки пересечения подавлен включением -1.
'y ~ 1 + (1 | g1)'Фиксированные эффекты для точки пересечения плюс случайный эффект для точки пересечения для каждого уровня сгруппированной переменной g1.
'y ~ X1 + (1 | g1)'Случайная модель точки пересечения с фиксированным наклоном.
'y ~ X1 + (X1 | g1)'Случайная точка пересечения и наклон, с возможной корреляцией между ними. Это эквивалентно 'y ~ 1 + X1 + (1 + X1|g1)'.
'y ~ X1 + (1 | g1) + (-1 + X1 | g1)' Независимые случайные эффекты называют для точки пересечения и наклона.
'y ~ 1 + (1 | g1) + (1 | g2) + (1 | g1:g2)'Случайная модель точки пересечения с независимыми основными эффектами для g1 и g2, плюс независимый эффект взаимодействия.
Введенный в R2014b