Пакет: classreg.regr
Компактный обобщенный линейный класс модели регрессии
CompactGeneralizedLinearModel
компактный обобщенный линейный объект модели регрессии. Это использует меньше памяти, чем полная обобщенная линейная модель регрессии (GeneralizedLinearModel
) потому что это не хранит данные, используемые, чтобы подбирать модель. Компактная модель не хранит входные данные, таким образом, вы не можете использовать ее, чтобы выполнить определенные задачи. Однако можно использовать компактную обобщенную линейную модель регрессии, чтобы предсказать ответы с помощью новых входных данных.
Подходящие операции (fitlm
, fitglm
...) автоматически используют компактные объекты, когда вы работаете с длинными массивами. Подходящие операции с таблицами в оперативной памяти и массивами производят полные объекты. Можно использовать compact
метод, чтобы сделать их меньшими.
возвращает компактную обобщенную линейную модель compactMdl
= compact(mdl
)compactMdl
регрессии из полной обобщенной линейной модели
mdl
регрессии. Для получения дополнительной информации смотрите
compact
.
mdl
— Полная обобщенная линейная модель регрессииGeneralizedLinearModel
объектПолная обобщенная линейная модель регрессии, заданная как GeneralizedLinearModel
объект.
CoefficientCovariance
— Ковариационная матрица содействующих оценокЭто свойство доступно только для чтения.
Ковариационная матрица содействующих оценок, заданных как p-by-p матрица числовых значений. p является количеством коэффициентов в подобранной модели.
Для получения дополнительной информации смотрите Содействующие Стандартные погрешности и Доверительные интервалы.
Типы данных: single
| double
CoefficientNames
— Содействующие именаЭто свойство доступно только для чтения.
Содействующие имена, заданные как массив ячеек из символьных векторов, каждый содержащий имя соответствующего термина.
Типы данных: cell
Coefficients
— Содействующие значенияЭто свойство доступно только для чтения.
Содействующие значения, заданные как таблица. Coefficients
содержит одну строку для каждого коэффициента и этих столбцов:
Estimate
— Предполагаемое содействующее значение
SE
— Стандартная погрешность оценки
tStat
— t - статистическая величина для теста, что коэффициент является нулем
pValue
— p - значение для t - статистическая величина
Используйте anova
(только для модели линейной регрессии) или coefTest
выполнять другие тесты на коэффициентах. Используйте coefCI
найти доверительные интервалы содействующих оценок.
Чтобы получить любой из этих столбцов как вектор, индексируйте в свойство с помощью записи через точку. Например, получите предполагаемый вектор коэффициентов в модели mdl
:
beta = mdl.Coefficients.Estimate
Типы данных: table
Deviance
— Отклонение подгонкиЭто свойство доступно только для чтения.
Отклонение подгонки, заданной как числовое значение. Отклонение полезно для сравнения двух моделей, когда каждый - особый случай другого. Различие между отклонением этих двух моделей имеет распределение хи-квадрат со степенями свободы, равными различию в количестве предполагаемых параметров между этими двумя моделями. Для получения дополнительной информации об отклонении смотрите Отклонение.
Типы данных: single
| double
DFE
— Степени свободы для ошибкиЭто свойство доступно только для чтения.
Степени свободы для ошибки (остаточные значения), равняйтесь количеству наблюдений минус количество предполагаемых коэффициентов, заданных как положительное целое число.
Типы данных: double
Dispersion
— Масштабный коэффициент отклонения ответаЭто свойство доступно только для чтения.
Масштабный коэффициент отклонения ответа, заданного как числовое значение. Dispersion
умножает функцию отклонения для распределения.
Например, функцией отклонения для биномиального распределения является p (1–p)/n, где p является параметром вероятности, и n является параметром объема выборки. Если Dispersion
около 1
, отклонение данных, кажется, соглашается с теоретическим отклонением биномиального распределения. Если Dispersion
больше, чем 1
, данные “сверхрассеиваются” относительно биномиального распределения.
Типы данных: double
DispersionEstimated
— Отметьте, чтобы указать на использование дисперсионного масштабного коэффициентаЭто свойство доступно только для чтения.
Отметьте, чтобы указать на использование дисперсионного масштабного коэффициента, заданного как логическое значение. Используйте DispersionEstimated
указать ли fitglm
используемый Dispersion
масштабный коэффициент, чтобы вычислить стандартные погрешности для коэффициентов в Coefficients.SE
. Если DispersionEstimated
false
, затем fitglm
используемый теоретическое значение отклонения.
DispersionEstimated
может быть false
только для 'binomial'
или 'poisson'
распределения.
Установить DispersionEstimated
, установите DispersionFlag
пара "имя-значение" в fitglm
.
Типы данных: логический
Distribution
— Обобщенная информация о распределенииЭто свойство доступно только для чтения.
Обобщенная информация распределения, указанная как структура со следующими полями, относящимися к обобщенному распределению.
Поле | Описание |
---|---|
Name | Имя распределения. Опции: 'normal' , 'binomial' , 'poisson' \Gamma , или 'inverse gaussian' . |
DevianceFunction | Функция, которая вычисляет компоненты отклонения как функция подходящих значений параметров и значений ответа. |
VarianceFunction | Функция, которая вычисляет теоретическое отклонение для распределения как функция подходящих значений параметров. Когда DispersionEstimated true , Dispersion умножает функцию отклонения в расчете содействующих стандартных погрешностей. |
Типы данных: struct
Formula
— Информация моделиLinearFormula
объектЭто свойство доступно только для чтения.
Информация модели, указанная как LinearFormula
объект.
Отобразите формулу подобранной модели mdl
использование записи через точку:
mdl.Formula
Link
— Функция ссылкиЭто свойство доступно только для чтения.
Функция ссылки, заданная как структура со следующими полями.
Поле | Описание |
---|---|
Name | Имя функции ссылки или '' если вы задали ссылку как указатель на функцию, а не вектор символов |
LinkFunction | Функция, которая задает f, указатель на функцию |
DevianceFunction | Производная f, указателя на функцию |
VarianceFunction | Инверсия f, указателя на функцию |
Ссылкой является функциональный f, который соединяет параметр распределения μ с подходящей линейной комбинацией Xb предикторов:
f (μ) = Xb.
Типы данных: struct
LogLikelihood
— Регистрируйте вероятностьЭто свойство доступно только для чтения.
Регистрируйте вероятность распределения модели в значениях ответа, заданных как числовое значение. Среднее значение адаптировано из модели, и другие параметры оцениваются как часть подгонки модели.
Типы данных: single
| double
ModelCriterion
— Критерий сравнения моделиЭто свойство доступно только для чтения.
Критерий сравнения модели, заданного как структура с этими полями:
AIC
— Критерий информации о Akaike. AIC = –2*logL + 2*m
, где logL
логарифмическая правдоподобность и m
количество предполагаемых параметров.
AICc
— Критерий информации о Akaike откорректирован для объема выборки. AICc = AIC + (2*m*(m+1))/(n–m–1)
, где n
количество наблюдений.
BIC
— Байесов информационный критерий. BIC = –2*logL + m*log(n)
.
CAIC
— Сопоставимый информационный критерий Akaike. CAIC = –2*logL + m*(log(n)+1)
.
Информационные критерии являются инструментами выбора модели, которые можно использовать, чтобы сравнить подгонку многоуровневых моделей к тем же данным. Эти критерии являются основанными на вероятности мерами подгонки модели, которые включают штраф за сложность (а именно, количество параметров). Различные информационные критерии отличает форма штрафа.
Когда вы сравниваете многоуровневые модели, модель с самым низким информационным значением критерия является моделью оптимальной подгонки. Модель оптимальной подгонки может варьироваться в зависимости от критерия, используемого в сравнении модели.
Чтобы получить любое из значений критерия как скаляр, индексируйте в свойство с помощью записи через точку. Например, получите значение AIC aic
в модели mdl
:
aic = mdl.ModelCriterion.AIC
Типы данных: struct
NumCoefficients
— Количество коэффициентов моделиЭто свойство доступно только для чтения.
Количество коэффициентов модели, заданных как положительное целое число. NumCoefficients
включает коэффициенты, которые обнуляются, когда условия модели имеют неполный ранг.
Типы данных: double
NumEstimatedCoefficients
— Количество предполагаемых коэффициентовЭто свойство доступно только для чтения.
Количество предполагаемых коэффициентов в модели, заданной как положительное целое число. NumEstimatedCoefficients
не включает коэффициенты, которые обнуляются, когда условия модели имеют неполный ранг. NumEstimatedCoefficients
степени свободы для регрессии.
Типы данных: double
NumObservations
— Количество наблюденийЭто свойство доступно только для чтения.
Количество наблюдений подходящая функция, используемая в подборе кривой, заданном как положительное целое число. NumObservations
количество наблюдений, предоставленных в исходной таблице, наборе данных или матрице, минус любые исключенные строки (набор с 'Exclude'
аргумент пары "имя-значение") или строки с отсутствующими значениями.
Типы данных: double
NumPredictors
— Количество переменных предикторовЭто свойство доступно только для чтения.
Количество переменных предикторов раньше подбирало модель, заданную как положительное целое число.
Типы данных: double
NumVariables
— Количество переменныхЭто свойство доступно только для чтения.
Количество переменных во входных данных, заданных как положительное целое число. NumVariables
количество переменных в исходной таблице или наборе данных или общем количестве столбцов в матрице предиктора и векторе отклика.
NumVariables
также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.
Типы данных: double
PredictorNames
— Имена предикторов раньше подбирали модельЭто свойство доступно только для чтения.
Имена предикторов раньше подбирали модель, заданную как массив ячеек из символьных векторов.
Типы данных: cell
ResponseName
— Имя переменной откликаЭто свойство доступно только для чтения.
Имя переменной отклика, заданное как вектор символов.
Типы данных: char
Rsquared
— Значение R-squared для моделиЭто свойство доступно только для чтения.
Значение R-squared для модели, заданной как структура с пятью полями:
Ordinary
— Обычный (неприспособленный) R-squared
Adjusted
— R-squared, настроенный для количества коэффициентов
LLR
— Отношение логарифмической правдоподобности
Deviance
— Отклонение
AdjGeneralized
— Настроенный обобщил R-squared
Значение R-squared является пропорцией полной суммы квадратов, объясненных моделью. Обычное значение R-squared относится к SSR
и SST
свойства:
Rsquared = SSR/SST = 1 - SSE/SST
.
Чтобы получить любое из этих значений как скаляр, индексируйте в свойство с помощью записи через точку. Например, настроенное значение R-squared в mdl
r2 = mdl.Rsquared.Adjusted
Типы данных: struct
SSE
— Сумма квадратичных невязокЭто свойство доступно только для чтения.
Сумма квадратичных невязок (остаточные значения), заданные как числовое значение.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
полная сумма квадратов, SSE
сумма квадратичных невязок и SSR
сумма квадратов регрессии.
Типы данных: single
| double
SSR
— Сумма квадратов регрессииЭто свойство доступно только для чтения.
Сумма квадратов регрессии, заданная как числовое значение. Сумма квадратов регрессии равна сумме отклонений в квадрате подходящих значений от их среднего значения.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
полная сумма квадратов, SSE
сумма квадратичных невязок и SSR
сумма квадратов регрессии.
Типы данных: single
| double
SST
— Полная сумма квадратовЭто свойство доступно только для чтения.
Полная сумма квадратов, заданных как числовое значение. Полная сумма квадратов равна сумме отклонений в квадрате вектора отклика y
от mean(y)
.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
полная сумма квадратов, SSE
сумма квадратичных невязок и SSR
сумма квадратов регрессии.
Типы данных: single
| double
VariableInfo
— Информация о переменныхЭто свойство доступно только для чтения.
Информация о переменных содержится в Variables
, заданный, когда таблица с одной строкой для каждой переменной и столбцов описана в этой таблице.
Столбец | Описание |
---|---|
Class | Переменный класс, заданный как массив ячеек из символьных векторов, такой как 'double' и 'categorical' |
Range | Переменный диапазон, указанный как массив ячеек векторов
|
InModel | Индикатор которого переменные находятся в подобранной модели, заданной как логический вектор. Значением является true если модель включает переменную. |
IsCategorical | Индикатор категориальных переменных, заданных как логический вектор. Значением является true если переменная является категориальной. |
VariableInfo
также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.
Типы данных: table
VariableNames
— Имена переменныхЭто свойство доступно только для чтения.
Имена переменных, заданных как массив ячеек из символьных векторов.
Если подгонка основана на таблице или наборе данных, это свойство обеспечивает имена переменных в таблице или наборе данных.
Если подгонка основана на матрице предиктора и векторе отклика, VariableNames
содержит значения, заданные 'VarNames'
аргумент пары "имя-значение" подходящего метода. Значение по умолчанию 'VarNames'
{'x1','x2',...,'xn','y'}
.
VariableNames
также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.
Типы данных: cell
coefCI | Доверительные интервалы содействующих оценок обобщенной линейной модели |
coefTest | Линейный тест гипотезы на обобщенных линейных коэффициентах модели регрессии |
devianceTest | Анализ отклонения |
disp | Отобразите обобщенную линейную модель регрессии |
feval | Оцените обобщенный линейный прогноз модели регрессии |
plotSlice | График срезов через подходящую обобщенную линейную поверхность регрессии |
предсказать | Предскажите ответ обобщенной линейной модели регрессии |
случайный | Симулируйте ответы для обобщенной линейной модели регрессии |
Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов (MATLAB).
Уменьшайте размер полной, подбиравшей обобщенной линейной модели регрессии путем отбрасывания выборочных данных и некоторой информации, связанной с подходящим процессом.
Загрузите данные в рабочую область. Симулированные выборочные данные содержат 15 000 наблюдений и 45 переменных предикторов.
load(fullfile(matlabroot,'examples','stats','largedata4reg.mat'))
Подбирайте обобщенную линейную модель регрессии к данным с помощью первых 15 переменных предикторов.
mdl = fitglm(X(:,1:15),Y)
mdl = Generalized linear regression model: y ~ [Linear formula with 16 terms in 15 predictors] Distribution = Normal Estimated Coefficients: Estimate SE tStat pValue ___________ __________ _______ ___________ (Intercept) 3.2903 0.00010447 31497 0 x1 -0.0006461 4.9991e-08 -12924 0 x2 -0.00024739 8.6874e-08 -2847.7 0 x3 -9.5161e-05 1.1138e-07 -854.38 0 x4 0.00013143 1.551e-07 847.35 0 x5 7.163e-05 1.9793e-07 361.9 0 x6 4.5064e-06 2.2247e-07 20.257 4.9539e-90 x7 -2.6258e-05 2.5462e-07 -103.13 0 x8 6.284e-05 2.5633e-07 245.15 0 x9 -0.00014288 2.817e-07 -507.19 0 x10 -2.2642e-05 3.0963e-07 -73.127 0 x11 -6.0227e-05 3.1639e-07 -190.36 0 x12 1.1665e-05 3.3921e-07 34.388 1.6995e-249 x13 3.8595e-05 3.5601e-07 108.41 0 x14 0.00010021 4.0312e-07 248.57 0 x15 -6.5674e-06 4.1692e-07 -15.752 1.844e-55 15000 observations, 14984 error degrees of freedom Estimated Dispersion: 0.000164 F-statistic vs. constant model: 1.18e+07, p-value = 0
Уплотните модель. Компактная модель отбрасывает исходные выборочные данные и некоторую информацию, связанную с подходящим процессом, таким образом, это использует меньше памяти, чем полная модель.
compactMdl = compact(mdl)
compactMdl = Compact generalized linear regression model: y ~ [Linear formula with 16 terms in 15 predictors] Distribution = Normal Estimated Coefficients: Estimate SE tStat pValue ___________ __________ _______ ___________ (Intercept) 3.2903 0.00010447 31497 0 x1 -0.0006461 4.9991e-08 -12924 0 x2 -0.00024739 8.6874e-08 -2847.7 0 x3 -9.5161e-05 1.1138e-07 -854.38 0 x4 0.00013143 1.551e-07 847.35 0 x5 7.163e-05 1.9793e-07 361.9 0 x6 4.5064e-06 2.2247e-07 20.257 4.9539e-90 x7 -2.6258e-05 2.5462e-07 -103.13 0 x8 6.284e-05 2.5633e-07 245.15 0 x9 -0.00014288 2.817e-07 -507.19 0 x10 -2.2642e-05 3.0963e-07 -73.127 0 x11 -6.0227e-05 3.1639e-07 -190.36 0 x12 1.1665e-05 3.3921e-07 34.388 1.6995e-249 x13 3.8595e-05 3.5601e-07 108.41 0 x14 0.00010021 4.0312e-07 248.57 0 x15 -6.5674e-06 4.1692e-07 -15.752 1.844e-55 15000 observations, 14984 error degrees of freedom Estimated Dispersion: 0.000164 F-statistic vs. constant model: 1.18e+07, p-value = 0
Указания и ограничения по применению:
Когда вы подбираете модель при помощи fitglm
или stepwiseglm
, следующие ограничения применяются.
Генерация кода не поддерживает категориальные предикторы. Вы не можете снабдить обучающими данными в таблице, которая содержит логический вектор, символьный массив, категориальный массив, массив строк или массив ячеек из символьных векторов. Кроме того, вы не можете использовать 'CategoricalVars'
аргумент пары "имя-значение". Чтобы включать категориальные предикторы в модель, предварительно обработайте категориальные предикторы при помощи dummyvar
прежде, чем подбирать модель.
Link
, Derivative
, и Inverse
поля 'Link'
аргументом пары "имя-значение" не могут быть анонимные функции. Таким образом, вы не можете сгенерировать код с помощью обобщенной линейной модели, которая была создана с помощью анонимных функций в ссылках. Вместо этого задайте функции для компонентов ссылки.
Для получения дополнительной информации смотрите Введение в Генерацию кода.
GeneralizedLinearModel
| compact
| fitglm
| plotPartialDependence
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.