fitglme

Подгонка обобщенной линейной модели смешанных эффектов

Синтаксис

glme = fitglme (таблица, формула)

glme = fitglme (таблица, формула, имя, значение)

Описание

glme = fitglme(tbl,formula) возвращает обобщенную линейную модель смешанных эффектов, glme. Модель определяется formula и подгоняют к переменным предиктора в таблице или массиве наборов данных, tbl.

glme = fitglme(tbl,formula,Name,Value) возвращает обобщенную линейную модель смешанных эффектов с использованием дополнительных опций, заданных одним или несколькими Name,Value аргументы пары. Например, можно задать распределение отклика, функции связи или ковариационного шаблона членов случайных эффектов.

Примеры

свернуть все

Подгонка обобщенной линейной модели смешанных эффектов

Открыть сценарий в реальном времени

Загрузите образцы данных.

load mfr

Эти смоделированные данные получены от производственной компании, которая эксплуатирует 50 заводов по всему миру, причем на каждом заводе выполняется пакетный процесс создания готового продукта. Компания хочет уменьшить количество дефектов в каждой партии, поэтому разработала новый производственный процесс. Чтобы проверить эффективность нового процесса, компания выбрала 20 своих заводов случайным образом для участия в эксперименте: Десять заводов реализовали новый процесс, в то время как другие десять продолжали запускать старый процесс. На каждом из 20 заводов компания провела пять партий (всего 100 партий) и записала следующие данные:

Флаг, указывающий, использовала ли партия новый процесс (newprocess)
Время обработки для каждой партии, в часах (time)
Температура партии, в градусах Цельсия (temp)
Категориальная переменная, указывающая поставщика химического вещества, используемого в партии (supplier)
Количество дефектов в партии (defects)

Данные также включают time_dev и temp_dev, которые представляют собой абсолютное отклонение времени и температуры соответственно от технологического стандарта 3 часов при 20 градусах Цельсия.

Подгонка обобщенной линейной модели смешанных эффектов с использованием newprocess, time_dev, temp_dev, и supplier в качестве предикторов с фиксированными эффектами. Включить термин случайных эффектов для перехвата, сгруппированного по factory, чтобы учесть различия в качестве, которые могут существовать из-за специфичных для завода вариаций. Переменная ответа defects имеет распределение Пуассона, и соответствующей функцией связи для этой модели является log. Для оценки коэффициентов используется метод аппроксимации Лапласа. Укажите фиктивную кодировку переменной как 'effects'так что фиктивные переменные коэффициенты суммируются до 0.

Количество дефектов можно смоделировать с помощью распределения Пуассона

$_{} defectsij∼Poisson (_{} мкидж$ ).

Это соответствует обобщенной линейной модели смешанных эффектов

$\log (_{} micij)_{=}_{β0} +_{}_{} {β1newprocessij +}_{} β2time_{_} {devij +}_{}_{} {β3temp _devij}_{+}_{} {β4supplier_}_{} {Cij}_{} +$ β5supplier _ Bij + bi,

где

$_{defectsij}$ - количество дефектов, наблюдаемых в партии, произведенной заводом $i$ во время партии $j$ .
$_{pciij}$ - среднее число дефектов, соответствующих заводу $i$ (где $i = 1,2, . . .,$ 20) во время партии j ( $где j = 1,2,$ ..., 5).
$_{newprocessij}$ , $_{time_devij}$ и $_{temp_devij}$ являются измерениями для каждой переменной, которые соответствуют фабрике $i$ во время партии $j$ . Например, $_{newprocessij}$ указывает, использовала ли партия, произведенная заводом i во время партии j, новый процесс.
$_{supplier_Cij}$ и $_{supplier_Bij}$ являются фиктивными переменными, которые используют кодирование эффектов (сумма к нулю), чтобы указать, C или B, соответственно, поставлялись технологические химикаты для партии, произведенной заводом $i$ во время партии $j$ .
$_{} bi∼N (0,_{}^{}$ startb2) - перехват случайных эффектов для каждой $фабрики$ i, который учитывает специфичные для фабрики вариации качества.

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)', ...
    'Distribution','Poisson','Link','log','FitMethod','Laplace', ...
    'DummyVarCoding','effects');

Отображение модели.

disp(glme)

Generalized linear mixed-effects model fit by ML

Model information:
    Number of observations             100
    Fixed effects coefficients           6
    Random effects coefficients         20
    Covariance parameters                1
    Distribution                    Poisson
    Link                            Log   
    FitMethod                       Laplace

Formula:
    defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1 | factory)

Model fit statistics:
    AIC       BIC       LogLikelihood    Deviance
    416.35    434.58    -201.17          402.35  

Fixed effects coefficients (95% CIs):
    Name                   Estimate     SE          tStat       DF    pValue    
    {'(Intercept)'}           1.4689     0.15988      9.1875    94    9.8194e-15
    {'newprocess' }         -0.36766     0.17755     -2.0708    94      0.041122
    {'time_dev'   }        -0.094521     0.82849    -0.11409    94       0.90941
    {'temp_dev'   }         -0.28317      0.9617    -0.29444    94       0.76907
    {'supplier_C' }        -0.071868    0.078024     -0.9211    94       0.35936
    {'supplier_B' }         0.071072     0.07739     0.91836    94       0.36078


    Lower        Upper    
       1.1515       1.7864
     -0.72019    -0.015134
      -1.7395       1.5505
      -2.1926       1.6263
     -0.22679     0.083051
    -0.082588      0.22473

Random effects covariance parameters:
Group: factory (20 Levels)
    Name1                  Name2                  Type           Estimate
    {'(Intercept)'}        {'(Intercept)'}        {'std'}        0.31381 

Group: Error
    Name                        Estimate
    {'sqrt(Dispersion)'}        1

Model information таблица отображает общее количество наблюдений в данных выборки (100), количество коэффициентов фиксированных и случайных эффектов (6 и 20 соответственно) и количество параметров ковариации (1). Это также указывает, что переменная ответа имеет Poisson распределение, функция линии связи Log, и метод подгонки Laplace.

Formula указывает спецификацию модели с помощью нотации Уилкинсона.

Model fit statistics В таблице представлены статистические данные, используемые для оценки соответствия модели. Это включает в себя информационный критерий Акаике (AIC), байесовский информационный критерий (BIC) значения, логарифмическое правдоподобие (LogLikelihood) и отклонение (Deviance) значения.

Fixed effects coefficients таблица показывает, что fitglme возвращены 95% доверительные интервалы. Он содержит одну строку для каждого предиктора с фиксированными эффектами, и каждый столбец содержит статистику, соответствующую этому предиктору. Столбец 1 (Name) содержит имя каждого коэффициента с фиксированными эффектами, столбец 2 (Estimate) содержит его оценочное значение и столбец 3 (SE) содержит стандартную ошибку коэффициента. Колонка 4 (tStat) содержит t-статистику для проверки гипотезы, что коэффициент равен 0. Столбец 5 (DF) и колонку 6 (pValue) содержат степени свободы и p-значение, которые соответствуют t-статистике соответственно. Последние два столбца (Lower и Upper) отображать нижний и верхний пределы, соответственно, 95% доверительного интервала для каждого коэффициента с фиксированными эффектами.

Random effects covariance parameters отображает таблицу для каждой переменной группировки (здесь, только factory), включая его общее количество уровней (20), и тип и оценку параметра ковариации. Здесь, std указывает, что fitglme возвращает стандартное отклонение случайного эффекта, связанного с заводским предиктором, которое имеет оценочное значение 0,31381. Также отображается таблица, содержащая тип параметра ошибки (здесь квадратный корень параметра дисперсии) и его оценочное значение 1.

Стандартный экран, созданный fitglme не обеспечивает доверительные интервалы для параметров случайных эффектов. Для вычисления и отображения этих значений используйте covarianceParameters.

Входные аргументы

свернуть все

`tbl` - Входные данные
таблица | массив наборов данных

Входные данные, которые включают переменную ответа, переменные предиктора и переменные группировки, указанные как таблица или массив наборов данных. Переменные предиктора могут быть непрерывными или группирующими переменными (см. Группирование переменных). Необходимо указать модель для переменных с помощью formula.

`formula` - Формула для спецификации модели
символьный вектор или строковый скаляр формы `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

Формула для спецификации модели, заданная как вектор символа или скаляр строки формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'. Формула чувствительна к регистру. Полное описание см. в разделе Формула.

Пример: 'y ~ treatment + (1|block)'

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects' задает распределение переменных ответа как Пуассона, функцию связи как log, метод аппроксимации как Лапласа и фиктивное кодирование переменных, где коэффициенты суммируются до 0.

`'BinomialSize'` - Количество испытаний для биномиального распределения
1 (по умолчанию) | скалярное значение | вектор | имя переменной

Число испытаний для биномиального распределения, то есть размера выборки, заданного как пара, разделенная запятыми, состоящая из скалярного значения, вектора той же длины, что и отклик, или имени переменной во входной таблице. Если указано имя переменной, она должна иметь ту же длину, что и отклик. BinomialSize применяется только в том случае, если Distribution параметр имеет значение 'binomial'.

Если BinomialSize является скалярным значением, что означает, что все наблюдения имеют одинаковое количество испытаний.

Типы данных: single | double

`'CheckHessian'` - Индикатор для проверки положительной определенности гессена
`false` (по умолчанию) | `true`

Индикатор для проверки положительной определённости гессена целевой функции относительно неограниченных параметров при сходимости, определяемой как разделённая запятыми пара, состоящая из 'CheckHessian' и либо false или true. По умолчанию: false.

Определить 'CheckHessian' как true для проверки оптимальности решения или для определения того, является ли модель сверхпараметризованной по количеству параметров ковариации.

При указании 'FitMethod' как 'MPL' или 'REMPL', то ковариация фиксированных эффектов и параметров ковариации основана на аппроксимированной линейной модели смешанных эффектов из окончательной псевдопонятной итерации.

Пример: 'CheckHessian',true

`'CovarianceMethod'` - Метод вычисления ковариации расчетных параметров
`'conditional'` (по умолчанию) | `'JointHessian'`

Метод вычисления ковариации оцениваемых параметров, определяемый как разделенная запятыми пара, состоящая из 'CovarianceMethod' и либо 'conditional' или 'JointHessian'. При указании 'conditional', то fitglme вычисляет быстрое приближение к ковариации фиксированных эффектов, учитывая оцененные параметры ковариации. Она не вычисляет ковариацию параметров ковариации. При указании 'JointHessian', то fitglme вычисляет совместную ковариацию фиксированных эффектов и параметров ковариации через наблюдаемую информационную матрицу, используя лапласовский логарифм.

Пример: 'CovarianceMethod','JointHessian'

`'CovariancePattern'` - Шаблон ковариационной матрицы
`'FullCholesky'` | `'Isotropic'` | `'Full'` | `'Diagonal'` | `'CompSymm'` | квадратная симметричная логическая матрица | строковый массив | массив ячеек символьных векторов или логических матриц

Шаблон ковариационной матрицы случайных эффектов, определяемый как разделенная запятыми пара, состоящая из 'CovariancePattern' и 'FullCholesky', 'Isotropic', 'Full', 'Diagonal', 'CompSymm', квадратную симметричную логическую матрицу, строковый массив или массив ячеек, содержащий векторы символов или логические матрицы.

Если есть R членов случайных эффектов, то значение 'CovariancePattern' должен быть строковым массивом или массивом ячеек длиной R, где каждый элемент r массива определяет шаблон ковариационной матрицы вектора случайных эффектов, связанного с членом случайных эффектов rth. Ниже приведены опции для каждого элемента.

Стоимость	Описание
`'FullCholesky'`	Полная ковариационная матрица с использованием параметризации Холески. `fitglme` оценивает все элементы ковариационной матрицы.
`'Isotropic'`	Диагональная ковариационная матрица с равными дисперсиями. То есть, внедиагональные элементы ковариационной матрицы ограничены равным 0, а диагональные элементы ограничены равным. Например, если существует три члена случайных эффектов с изотропной ковариационной структурой, эта ковариационная матрица выглядит как $\begin{matrix} _{}^{} \\ _{}^{} \\ _{}^{} \end{matrix} (σb2000σb2000σb2)$ где ^start21 - общая дисперсия членов случайных эффектов.
`'Full'`	Полная ковариационная матрица с использованием логарифмической параметризации Холеского. `fitlme` оценивает все элементы ковариационной матрицы.
`'Diagonal'`	Диагональная ковариационная матрица. То есть, внедиагональные элементы ковариационной матрицы ограничены 0. $\begin{matrix} _{}^{} \\ _{}^{} \\ _{}^{} \end{matrix} (σb12000σb22000σb32)$
`'CompSymm'`	Составная структура симметрии. То есть общая дисперсия по диагоналям и равная корреляция между всеми случайными эффектами. Например, если есть три члена случайных эффектов с ковариационной матрицей, имеющей структуру составной симметрии, эта ковариационная матрица выглядит как $(\begin{matrix} _{}^{} & _{σb12σb1,} & _{b2σb1,} \\ _{b2σb1,} & _{}^{} & _{b2σb12σb1,} \\ _{b2σb1,} & _{b2σb1,} & _{}^{b2σb12} \end{matrix})$ где ^start2b1 является общей дисперсией членов случайных эффектов, а _{startb1, b2} является общей ковариацией между любыми двумя членами случайных эффектов.
`PAT`	Квадратно-симметричная логическая матрица. Если `'CovariancePattern'` определяется матрицей `PAT`, и если `PAT(a,b) = false`, то `(a,b)` элемент соответствующей ковариационной матрицы ограничен значением 0.

Для скалярных членов случайных эффектов по умолчанию 'Isotropic'. В противном случае значение по умолчанию - 'FullCholesky'.

Пример: 'CovariancePattern','Diagonal'

Пример: 'CovariancePattern',{'Full','Diagonal'}

Типы данных: char | string | logical | cell

`'DispersionFlag'` - Индикатор для вычисления параметра дисперсии
`false` для `'binomial'` и `'poisson'` распределения (по умолчанию) | `true`

Индикатор для вычисления параметра дисперсии 'binomial' и 'poisson' распределения, указанные как пара, разделенная запятыми, состоящая из 'DispersionFlag' и одно из следующих.

Стоимость	Описание
`true`	Оценка параметра дисперсии при вычислении стандартных ошибок
`false`	Использовать теоретическое значение `1.0` при вычислении стандартных ошибок

'DispersionFlag' применяется только в том случае, если 'FitMethod' является 'MPL' или 'REMPL'.

Функция аппроксимации всегда оценивает дисперсию для других распределений.

Пример: 'DispersionFlag',true

`'Distribution'` - Распределение переменной ответа
`'Normal'` (по умолчанию) | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

Распределение переменной ответа, указанной как разделенная запятыми пара, состоящая из 'Distribution' и одно из следующих.

Стоимость	Описание
`'Normal'`	Нормальное распределение
`'Binomial'`	Биномиальное распределение
`'Poisson'`	Распределение Пуассона
`'Gamma'`	Гамма-распределение
`'InverseGaussian'`	Обратное гауссово распределение

Пример: 'Distribution','Binomial'

`'DummyVarCoding'` - Кодирование для использования в фиктивных переменных
`'reference'` (по умолчанию) | `'effects'` | `'full'`

Кодирование для использования фиктивных переменных, созданных из категориальных переменных, указанных как разделенная запятыми пара, состоящая из 'DummyVarCoding' и одна из переменных в этой таблице.

Стоимость	Описание
`'reference'` (по умолчанию)	`fitglme` создает фиктивные переменные со ссылочной группой. Эта схема рассматривает первую категорию как группу ссылок и создает на одну фиктивную переменную меньше, чем количество категорий. Можно проверить порядок категорий категориальной переменной с помощью `categories` и изменить порядок с помощью `reordercats` функция.
`'effects'`	`fitglme` создает фиктивные переменные с использованием кодирования эффектов. Эта схема использует -1 для представления последней категории. Эта схема создает на одну фиктивную переменную меньше числа категорий.
`'full'`	`fitglme` создает полные фиктивные переменные. Эта схема создает одну фиктивную переменную для каждой категории.

Дополнительные сведения о создании фиктивных переменных см. в разделе Автоматическое создание фиктивных переменных.

Пример: 'DummyVarCoding','effects'

`'EBMethod'` - Метод, используемый для аппроксимации эмпирических оценок случайных эффектов Байеса
`'Auto'` (по умолчанию) | `'LineSearchNewton'` | `'TrustRegion2D'` | `'fsolve'`

Метод, используемый для аппроксимации эмпирических оценок Байеса случайных эффектов, указанных как пара, разделенная запятыми, состоящая из 'EBMethod' и одно из следующих.

'Auto'
'LineSearchNewton'
'TrustRegion2D'
'fsolve'

'Auto' аналогичен 'LineSearchNewton' но использует другой критерий сходимости и не отображает итеративный прогресс. 'Auto' и 'LineSearchNewton' может привести к отказу неканонических функций связи. Для неканонических функций связи, 'TrustRegion2D' или 'fsolve' рекомендуется. Для использования необходимо иметь Toolbox™ оптимизации 'fsolve'.

Пример: 'EBMethod','LineSearchNewton'

`'EBOptions'` - Варианты эмпирической оптимизации Байеса
структура

Опции эмпирической оптимизации Байеса, указанные как разделенная запятыми пара, состоящая из 'EBOptions' и структуру, содержащую следующее.

Стоимость	Описание
`'TolFun'`	Относительный допуск для градиентной нормы. Значение по умолчанию - 1e-6.
`'TolX'`	Абсолютный допуск по размеру шага. Значение по умолчанию - 1e-8.
`'MaxIter'`	Максимальное число итераций. Значение по умолчанию - 100.
`'Display'`	`'off'`, `'iter'`, или `'final'`. По умолчанию: `'off'`.

Если EBMethod является 'Auto' и 'FitMethod' является 'Laplace', TolFun - относительный допуск на линейном предикторе модели, и 'Display' параметр не применяется.

Если 'EBMethod' является 'fsolve', то 'EBOptions' должен быть указан как объект, созданный optimoptions('fsolve').

Типы данных: struct

`'Exclude'` - Индексы для исключаемых строк
использовать все строки без `NaNs` (по умолчанию) | вектор целых или логических значений

Индексы строк для исключения из обобщенной линейной модели смешанных эффектов в данных, указанной как разделенная запятыми пара, состоящая из 'Exclude' и вектор целых или логических значений.

Например, можно исключить 13-ю и 67-ю строки из посадки следующим образом.

Пример: 'Exclude',[13,67]

Типы данных: single | double | logical

`'FitMethod'` - Метод оценки параметров модели
`'MPL'` (по умолчанию) | `'REMPL'` | `'Laplace'` | `'ApproximateLaplace`

Метод оценки параметров модели, определяемый как разделенная запятыми пара, состоящая из 'FitMethod' и одно из следующих.

'MPL' - Максимальное псевдоправдоподобие
'REMPL' - Ограниченная максимальная псевдопонятность
'Laplace' - Максимальная вероятность с помощью аппроксимации Лапласа
'ApproximateLaplace' - Максимальная вероятность с использованием аппроксимации Лапласа с профилированными фиксированными эффектами

Пример: 'FitMethod','REMPL'

`'InitPLIterations'` - Начальное число псевдо-правдоподобных итераций
10 (по умолчанию) | целочисленное значение в диапазоне [1,∞)

Начальное число псевдо-правдоподобных итераций, использованных для инициализации параметров для ApproximateLaplace и Laplace методы подгонки, указанные как пара, разделенная запятыми, состоящая из 'InitPLIterations' и целое значение, большее или равное 1.

Типы данных: single | double

`'Link'` - Функция связи
`'identity'` | `'log'` | `'logit'` | `'probit'` | `'comploglog'` | `'reciprocal'` | скалярное значение | структура

Функция связи, заданная как разделенная запятыми пара, состоящая из 'Link' и одно из следующих.

Стоимость	Описание
`'identity'`	`g(mu) = mu` Это значение по умолчанию для обычного распределения.
`'log'`	`g(mu) = log(mu)` Это значение по умолчанию для распределения Пуассона.
`'logit'`	`g(mu) = log(mu/(1-mu))` Это значение по умолчанию для биномиального распределения.
`'loglog'`	`g(mu) = log(-log(mu))`
`'probit'`	`g(mu) = norminv(mu)`
`'comploglog'`	`g(mu) = log(-log(1-mu))`
`'reciprocal'`	`g(mu) = mu.^(-1)`
Скалярное значение `P`	`g(mu) = mu.^P`
Структура `S`	Структура, содержащая четыре поля, значения которых являются дескрипторами функций, имеет следующие имена: `S.Link` - Функция связи `S.Derivative` - Производная `S.SecondDerivative` - Вторая производная `S.Inverse` - Обратная связь Спецификация `S.SecondDerivative` может быть опущен, если `FitMethod` является `MPL` или `REMPL`, или если `S` является канонической ссылкой для указанного распространения.

Функция связи по умолчанию, используемая fitglme - каноническая связь, которая зависит от распределения ответа.

Распределение ответов	Каноническая линк-функция
`'Normal'`	`'identity'`
`'Binomial'`	`'logit'`
`'Poisson'`	`'log'`
`'Gamma'`	`-1`
`'InverseGaussian'`	`-2`

Пример: 'Link','log'

Типы данных: char | string | single | double | struct

`'MuStart'` - Начальное значение для условного среднего
скалярное значение

Начальное значение для условного среднего, указанного как разделенная запятыми пара, состоящая из 'MuStart' и скалярное значение. Допустимые значения:

Распределение ответов	Допустимые значения
`'Normal'`	`(-Inf,Inf)`
`'Binomial'`	`(0,1)`
`'Poisson'`	`(0,Inf)`
`'Gamma'`	`(0,Inf)`
`'InverseGaussian'`	`(0,Inf)`

Типы данных: single | double

`'Offset'` - Смещение
`zeros(n,1)` (по умолчанию) | вектор n-by-1 скалярных значений

Смещение, указанное как разделенная запятыми пара, состоящая из 'Offset' и вектор n-на-1 скалярных значений, где n - длина вектора отклика. Можно также указать имя переменной вектора скалярных значений n-by-1. 'Offset' используется в качестве дополнительного предиктора, который имеет значение коэффициента, фиксированное на 1.0.

Типы данных: single | double

`'Optimizer'` - Алгоритм оптимизации
`'quasinewton'` (по умолчанию) | `'fminsearch'` | `'fminunc'`

Алгоритм оптимизации, указанный как пара, разделенная запятыми, состоящая из 'Optimizer' и любое из следующего.

Стоимость	Описание
`'quasinewton'`	Использует квазиньютоновский оптимизатор на основе области доверия. Изменить параметры алгоритма можно с помощью `statset('fitglme')`. Если параметры не указаны, то `fitglme` использует опции по умолчанию `statset('fitglme')`.
`'fminsearch'`	Использует метод Нелдера-Мид без производных. Изменить параметры алгоритма можно с помощью `optimset('fminsearch')`. Если параметры не указаны, то `fitglme` использует опции по умолчанию `optimset('fminsearch')`.
`'fminunc'`	Использует метод квази-Ньютона на основе поиска строк. Чтобы задать этот параметр, необходимо иметь панель инструментов оптимизации. Изменить параметры алгоритма можно с помощью `optimoptions('fminunc')`. Если параметры не указаны, то `fitglme` использует опции по умолчанию `optimoptions('fminunc')` с `'Algorithm'` установить в значение `'quasi-newton'`.

Пример: 'Optimizer','fminsearch'

`'OptimizerOptions'` - Варианты алгоритма оптимизации
структура, возвращенная `statset` | структура, возвращенная `optimset` | объект, возвращенный `optimoptions`

Опции алгоритма оптимизации, указанные как разделенная запятыми пара, состоящая из 'OptimizerOptions' и структура, возвращенная statset('fitglme'), структура, созданная optimset('fminsearch')или объект, возвращенный optimoptions('fminunc').

Если 'Optimizer' является 'fminsearch', затем использовать optimset('fminsearch') для изменения параметров алгоритма. Если 'Optimizer' является 'fminsearch' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimset('fminsearch').
Если 'Optimizer' является 'fminunc', затем использовать optimoptions('fminunc') для изменения параметров алгоритма оптимизации. Посмотрите optimoptions для опций 'fminunc' использует. Если 'Optimizer' является 'fminunc' и вы не поставляете 'OptimizerOptions', затем значения по умолчанию, используемые в fitglme являются опциями по умолчанию, созданными optimoptions('fminunc') с 'Algorithm' установить в значение 'quasi-newton'.
Если 'Optimizer' является 'quasinewton', затем использовать statset('fitglme') для изменения параметров оптимизации. Если 'Optimizer' является 'quasinewton' и вы не изменяете параметры оптимизации с помощью statset, то fitglme использует параметры по умолчанию, созданные statset('fitglme').

'quasinewton' оптимизатор использует следующие поля в структуре, созданной statset('fitglme').

`TolFun` - Относительный допуск по градиенту целевой функции
`1e-6` (по умолчанию) | положительное скалярное значение

Относительный допуск для градиента целевой функции, определяемый как положительное скалярное значение.

`TolX` - Абсолютный допуск по размеру шага
`1e-12` (по умолчанию) | положительное скалярное значение

Абсолютный допуск для размера шага, заданный как положительное скалярное значение.

`MaxIter` - Максимально допустимое число итераций
`10000` (по умолчанию) | положительное скалярное значение

Максимально допустимое число итераций, указанное как положительное скалярное значение.

`Display` - Уровень отображения
`'off'` (по умолчанию) | `'iter'` | `'final'`

Уровень отображения, указанный как один из 'off', 'iter', или 'final'.

`'PLIterations'` - Максимальное число псевдо-правдоподобных итераций
`100` (по умолчанию) | положительное целое значение

Максимальное число итераций псевдоправдоподобия (PL), указанное как пара, разделенная запятыми, состоящая из 'PLIterations' и положительное целое значение. PL используется для подгонки модели, если 'FitMethod' является 'MPL' или 'REMPL'. Для других 'FitMethod' значения, итерации PL используются для инициализации параметров для последующей оптимизации.

Пример: 'PLIterations',200

Типы данных: single | double

`'PLTolerance'` - Коэффициент относительного допуска для псевдопонятных итераций
`1e–08` (по умолчанию) | положительное скалярное значение

Коэффициент относительного допуска для псевдо-правдоподобных итераций, указанный как пара, разделенная запятыми, состоящая из 'PLTolerance' и положительное скалярное значение.

Пример: 'PLTolerance',1e-06

Типы данных: single | double

`'StartMethod'` - Метод запуска итеративной оптимизации
`'default'` (по умолчанию) | `'random'`

Метод запуска итеративной оптимизации, указанный как разделенная запятыми пара, состоящая из 'StartMethod' и любое из следующего.

Стоимость	Описание
`'default'`	Внутреннее значение по умолчанию
`'random'`	Случайное начальное значение

Пример: 'StartMethod','random'

`'UseSequentialFitting'` - Начальный тип фитинга
`false` (по умолчанию) | `true`

, указанная как пара, разделенная запятыми, состоящая из 'UseSequentialFitting' и либо false или true. Если 'UseSequentialFitting' является false, все методы максимального правдоподобия инициализируются с использованием одной или более псевдопонятных итераций правдоподобия. Если 'UseSequentialFitting' является true, исходные значения из псевдо правдоподобных итераций уточняются с использованием 'ApproximateLaplace' для 'Laplace' фитинг.

Пример: 'UseSequentialFitting',true

`'Verbose'` - Индикатор для отображения процесса оптимизации на экране
`0` (по умолчанию) | `1` | `2`

Индикатор для отображения процесса оптимизации на экране, указанный как разделенная запятыми пара, состоящая из 'Verbose' и 0, 1, или 2. Если 'Verbose' указывается как 1 или 2, то fitglme отображает ход итеративного процесса подгонки модели. Определение 'Verbose' как 2 отображает информацию итеративной оптимизации из отдельных псевдопонятных итераций. Определение 'Verbose' как 1 пропускает этот дисплей.

Настройка для 'Verbose' переопределяет поле 'Display' в 'OptimizerOptions'.

Пример: 'Verbose',1

`'Weights'` - Наблюдательные веса
вектор неотрицательных скалярных значений

Веса наблюдения, указанные как разделенная запятыми пара, состоящая из 'Weights' и вектор n-by-1 неотрицательных скалярных значений, где n - число наблюдений. Если распределение ответа биномиальное или Пуассона, то 'Weights' должен быть вектором положительных целых чисел.

Типы данных: single | double

Выходные аргументы

свернуть все

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект

Обобщенная линейная модель смешанных эффектов, указанная как GeneralizedLinearMixedModel объект. Свойства и методы этого объекта см. в разделе GeneralizedLinearMixedModel.

Подробнее

свернуть все

Формула

В общем случае формула для спецификации модели - это вектор символов или строковый скаляр вида 'y ~ terms'. Для обобщенных линейных моделей смешанных эффектов эта формула имеет вид 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)', где fixed и random содержат фиксированные эффекты и случайные эффекты.

Предположим, таблица tbl содержит:

Переменная ответа, y
Переменные предиктора, X_j, которые могут быть непрерывными или группирующими переменными
Группирование переменных, g₁, g₂, ..., g_R,

где переменные группирования в X_j и g_r могут быть категориальными, логическими, символьными массивами, строковыми массивами или массивами ячеек символьных векторов.

Затем, в формуле вида, 'y ~ fixed + (random₁|g₁) + ... + (random_R|g_R)', термин fixed соответствует спецификации матрицы проектирования с фиксированными эффектами X, random₁ - спецификация матрицы проектирования случайных эффектов Z₁, соответствующий переменной группировки g₁, и аналогично random_R - спецификация матрицы проектирования случайных эффектов. Z_R соответствует переменной группировки g_R. Вы можете выразить fixed и random термины, использующие нотацию Уилкинсона.

Нотация Уилкинсона описывает факторы, присутствующие в моделях. Обозначение относится к факторам, присутствующим в моделях, а не к множителям (коэффициентам) этих факторов.

Нотация Уилкинсона	Коэффициенты в стандартной нотации
`1`	Член константы (перехвата)
`X^k`, где `k` является положительным целым числом	`X`, `X²`, ..., `X^k`
`X1 + X2`	`X1`, `X2`
`X1*X2`	`X1`, `X2`, `X1.*X2 (elementwise multiplication of X1 and X2)`
`X1:X2`	`X1.*X2` только
`- X2`	Не включать `X2`
`X1*X2 + X3`	`X1`, `X2`, `X3`, `X1*X2`
`X1 + X2 + X3 + X1:X2`	`X1`, `X2`, `X3`, `X1*X2`
`X1X2X3 - X1:X2:X3`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`, `X2*X3`
`X1*(X2 + X3)`	`X1`, `X2`, `X3`, `X1X2`, `X1X3`

В нотации Statistics and Machine Learning Toolbox™ всегда содержится постоянный термин, если вы явно не удалили термин с помощью -1. Вот несколько примеров для обобщенной линейной спецификации модели смешанных эффектов.

Примеры:

Формула	Описание
`'y ~ X1 + X2'`	Фиксированные эффекты для перехвата, `X1` и `X2`. Это эквивалентно `'y ~ 1 + X1 + X2'`.
`'y ~ -1 + X1 + X2'`	Отсутствие перехвата и фиксированных эффектов для `X1` и `X2`. Неявный член перехвата подавляется включением `-1`.
`'y ~ 1 + (1 \| g1)'`	Фиксированные эффекты для перехвата плюс случайный эффект для перехвата для каждого уровня переменной группировки `g1`.
`'y ~ X1 + (1 \| g1)'`	Модель случайного пересечения с фиксированным наклоном.
`'y ~ X1 + (X1 \| g1)'`	Случайный перехват и наклон, с возможной корреляцией между ними. Это эквивалентно `'y ~ 1 + X1 + (1 + X1\|g1)'`.
`'y ~ X1 + (1 \| g1) + (-1 + X1 \| g1)'`	Независимые термины случайных эффектов для перехвата и наклона.
`'y ~ 1 + (1 \| g1) + (1 \| g2) + (1 \| g1:g2)'`	Модель случайного перехвата с независимыми основными эффектами для `g1` и `g2`плюс независимый эффект взаимодействия.

См. также

GeneralizedLinearMixedModel

Темы

Представлен в R2014b

Документация

fitglme

Синтаксис

Описание

Примеры

Подгонка обобщенной линейной модели смешанных эффектов

Входные аргументы

tbl - Входные данные таблица | массив наборов данных

formula - Формула для спецификации модели символьный вектор или строковый скаляр формы 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'

Аргументы пары «имя-значение»

'BinomialSize' - Количество испытаний для биномиального распределения 1 (по умолчанию) | скалярное значение | вектор | имя переменной

'CheckHessian' - Индикатор для проверки положительной определенности гессена false (по умолчанию) | true

'CovarianceMethod' - Метод вычисления ковариации расчетных параметров 'conditional' (по умолчанию) | 'JointHessian'

'DispersionFlag' - Индикатор для вычисления параметра дисперсии false для 'binomial' и 'poisson' распределения (по умолчанию) | true

'Distribution' - Распределение переменной ответа 'Normal' (по умолчанию) | 'Binomial' | 'Poisson' | 'Gamma' | 'InverseGaussian'

'DummyVarCoding' - Кодирование для использования в фиктивных переменных 'reference' (по умолчанию) | 'effects' | 'full'

'EBMethod' - Метод, используемый для аппроксимации эмпирических оценок случайных эффектов Байеса 'Auto' (по умолчанию) | 'LineSearchNewton' | 'TrustRegion2D' | 'fsolve'

'EBOptions' - Варианты эмпирической оптимизации Байеса структура

'Exclude' - Индексы для исключаемых строк использовать все строки без NaNs (по умолчанию) | вектор целых или логических значений

'FitMethod' - Метод оценки параметров модели 'MPL' (по умолчанию) | 'REMPL' | 'Laplace' | 'ApproximateLaplace

'InitPLIterations' - Начальное число псевдо-правдоподобных итераций 10 (по умолчанию) | целочисленное значение в диапазоне [1,∞)

'Link' - Функция связи 'identity' | 'log' | 'logit' | 'probit' | 'comploglog' | 'reciprocal' | скалярное значение | структура

'MuStart' - Начальное значение для условного среднего скалярное значение

'Offset' - Смещение zeros(n,1) (по умолчанию) | вектор n-by-1 скалярных значений

'Optimizer' - Алгоритм оптимизации 'quasinewton' (по умолчанию) | 'fminsearch' | 'fminunc'

'OptimizerOptions' - Варианты алгоритма оптимизации структура, возвращенная statset | структура, возвращенная optimset | объект, возвращенный optimoptions

TolFun - Относительный допуск по градиенту целевой функции 1e-6 (по умолчанию) | положительное скалярное значение

TolX - Абсолютный допуск по размеру шага 1e-12 (по умолчанию) | положительное скалярное значение

MaxIter - Максимально допустимое число итераций 10000 (по умолчанию) | положительное скалярное значение

Display - Уровень отображения 'off' (по умолчанию) | 'iter' | 'final'

'PLIterations' - Максимальное число псевдо-правдоподобных итераций 100 (по умолчанию) | положительное целое значение

'PLTolerance' - Коэффициент относительного допуска для псевдопонятных итераций 1e–08 (по умолчанию) | положительное скалярное значение

'StartMethod' - Метод запуска итеративной оптимизации 'default' (по умолчанию) | 'random'

'UseSequentialFitting' - Начальный тип фитинга false (по умолчанию) | true

'Verbose' - Индикатор для отображения процесса оптимизации на экране 0 (по умолчанию) | 1 | 2

'Weights' - Наблюдательные веса вектор неотрицательных скалярных значений

Выходные аргументы

glme - Обобщенная линейная модель смешанных эффектов GeneralizedLinearMixedModel объект

Подробнее

Формула

См. также

Темы

Документация по инструментам для статистического и машинного обучения

Поддержка

`tbl` - Входные данные
таблица | массив наборов данных

`formula` - Формула для спецификации модели
символьный вектор или строковый скаляр формы `'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)'`

`'BinomialSize'` - Количество испытаний для биномиального распределения
1 (по умолчанию) | скалярное значение | вектор | имя переменной

`'CheckHessian'` - Индикатор для проверки положительной определенности гессена
`false` (по умолчанию) | `true`

`'CovarianceMethod'` - Метод вычисления ковариации расчетных параметров
`'conditional'` (по умолчанию) | `'JointHessian'`

`'DispersionFlag'` - Индикатор для вычисления параметра дисперсии
`false` для `'binomial'` и `'poisson'` распределения (по умолчанию) | `true`

`'Distribution'` - Распределение переменной ответа
`'Normal'` (по умолчанию) | `'Binomial'` | `'Poisson'` | `'Gamma'` | `'InverseGaussian'`

`'DummyVarCoding'` - Кодирование для использования в фиктивных переменных
`'reference'` (по умолчанию) | `'effects'` | `'full'`

`'EBMethod'` - Метод, используемый для аппроксимации эмпирических оценок случайных эффектов Байеса
`'Auto'` (по умолчанию) | `'LineSearchNewton'` | `'TrustRegion2D'` | `'fsolve'`

`'EBOptions'` - Варианты эмпирической оптимизации Байеса
структура

`'Exclude'` - Индексы для исключаемых строк
использовать все строки без `NaNs` (по умолчанию) | вектор целых или логических значений

`'FitMethod'` - Метод оценки параметров модели
`'MPL'` (по умолчанию) | `'REMPL'` | `'Laplace'` | `'ApproximateLaplace`

`'InitPLIterations'` - Начальное число псевдо-правдоподобных итераций
10 (по умолчанию) | целочисленное значение в диапазоне [1,∞)

`'Link'` - Функция связи
`'identity'` | `'log'` | `'logit'` | `'probit'` | `'comploglog'` | `'reciprocal'` | скалярное значение | структура

`'MuStart'` - Начальное значение для условного среднего
скалярное значение

`'Offset'` - Смещение
`zeros(n,1)` (по умолчанию) | вектор n-by-1 скалярных значений

`'Optimizer'` - Алгоритм оптимизации
`'quasinewton'` (по умолчанию) | `'fminsearch'` | `'fminunc'`

`'OptimizerOptions'` - Варианты алгоритма оптимизации
структура, возвращенная `statset` | структура, возвращенная `optimset` | объект, возвращенный `optimoptions`

`TolFun` - Относительный допуск по градиенту целевой функции
`1e-6` (по умолчанию) | положительное скалярное значение

`TolX` - Абсолютный допуск по размеру шага
`1e-12` (по умолчанию) | положительное скалярное значение

`MaxIter` - Максимально допустимое число итераций
`10000` (по умолчанию) | положительное скалярное значение

`Display` - Уровень отображения
`'off'` (по умолчанию) | `'iter'` | `'final'`

`'PLIterations'` - Максимальное число псевдо-правдоподобных итераций
`100` (по умолчанию) | положительное целое значение

`'PLTolerance'` - Коэффициент относительного допуска для псевдопонятных итераций
`1e–08` (по умолчанию) | положительное скалярное значение

`'StartMethod'` - Метод запуска итеративной оптимизации
`'default'` (по умолчанию) | `'random'`

`'UseSequentialFitting'` - Начальный тип фитинга
`false` (по умолчанию) | `true`

`'Verbose'` - Индикатор для отображения процесса оптимизации на экране
`0` (по умолчанию) | `1` | `2`

`'Weights'` - Наблюдательные веса
вектор неотрицательных скалярных значений

`glme` - Обобщенная линейная модель смешанных эффектов
`GeneralizedLinearMixedModel` объект