Создайте обобщенную модель линейной регрессии
mdl = fitglm(tbl)
mdl = fitglm(X,y)
mdl = fitglm(___,modelspec)
mdl = fitglm(___,Name,Value)
возвращает обобщенную линейную модель с дополнительными опциями, заданными одним или несколькими аргументами пары mdl
= fitglm(___,Name,Value
)Name,Value
.
Например, можно задать, который переменные являются категориальными, распределение переменной отклика и функция ссылки, чтобы использовать.
Обобщенная линейная модель mdl
является стандартной линейной моделью, если вы не задаете в противном случае с парой "имя-значение" Distribution
.
Для методов, таких как plotResiduals
или devianceTest
или свойства объекта GeneralizedLinearModel
, смотрите GeneralizedLinearModel
.
После обучения модель можно сгенерировать код C/C++, который предсказывает ответы для новых данных. Генерация кода C/C++ требует MATLAB® Coder™. Для получения дополнительной информации смотрите Введение в Генерацию кода.
fitglm
обрабатывает категориальный предиктор можно следующим образом:
Модель с категориальным предиктором, который имеет уровни L (категории), включает переменные индикатора L - 1. Модель использует первую категорию в качестве контрольного уровня, таким образом, это не включает переменную индикатора для контрольного уровня. Если типом данных категориального предиктора является categorical
, то можно проверять порядок категорий при помощи categories
и переупорядочить категории при помощи reordercats
, чтобы настроить контрольный уровень.
fitglm
обрабатывает группу переменных индикатора L - 1 как одна переменная. Если вы хотите обработать переменные индикатора как отличные переменные прогноза, создайте переменные индикатора вручную при помощи dummyvar
. Затем используйте переменные индикатора, кроме той, соответствующей контрольному уровню категориальной переменной, когда вы подберете модель. Для категориального предиктора X
, если вы задаете все столбцы dummyvar(X)
и термина прерывания в качестве предикторов, затем матрица проекта, становится неполным рангом.
Периоды взаимодействия между непрерывным предиктором и категориальным предиктором с уровнями L состоят из поэлементного произведения переменных индикатора L - 1 с непрерывным предиктором.
Периоды взаимодействия между двумя категориальными предикторами с L и уровнями M состоят из (L – 1) * переменные индикатора (M - 1), чтобы включать все возможные комбинации двух категориальных уровней предиктора.
Вы не можете задать условия высшего порядка для категориального предиктора, потому что квадрат индикатора равен себе.
fitglm
полагает, что NaN
, ''
(пустой символьный вектор), ""
(пустая строка), <missing>
и значения <undefined>
в tbl
, X
и Y
отсутствующие значения. fitglm
не использует наблюдения с отсутствующими значениями в подгонке. Свойство ObservationInfo
подобранной модели указывает, использует ли fitglm
каждое наблюдение в подгонке.
Используйте stepwiseglm
, чтобы выбрать образцовую спецификацию автоматически. Используйте step
, addTerms
или removeTerms
, чтобы настроить подобранную модель.
[1] Collett, D. Моделирование двоичных данных. Нью-Йорк: Chapman & Hall, 2002.
[2] Добсон, A. J. Введение в обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.
[3] Маккуллаг, P. и Дж. А. Нелдер. Обобщенные линейные модели. Нью-Йорк: Chapman & Hall, 1990.