Компактная линейная регрессионая модель
CompactLinearModel
является компактной версией объекта модели полной линейной регрессии LinearModel
. Поскольку компактная модель не хранит входные данные, используемые для соответствия модели, или информацию, относящуюся к процессу аппроксимации, CompactLinearModel
объект потребляет меньше памяти, чем LinearModel
объект. Вы все еще можете использовать компактную модель для предсказания откликов с помощью новых входных данных, но некоторых LinearModel
функции объекта не работают с компактной моделью.
Создайте CompactLinearModel
модель из полного, обученного LinearModel
моделировать при помощи compact
.
CoefficientCovariance
- Ковариационная матрица оценок коэффициентовЭто свойство доступно только для чтения.
Ковариационная матрица оценок коэффициентов, заданная в виде p -by - p матрицы числовых значений. p - количество коэффициентов в подобранной модели.
Для получения дополнительной информации см. «Стандартные ошибки коэффициентов и доверительные интервалы».
Типы данных: single
| double
CoefficientNames
- Имена коэффициентовЭто свойство доступно только для чтения.
Имена коэффициентов, заданные как массив ячеек из векторов символов, каждый из которых содержит имя соответствующего термина.
Типы данных: cell
Coefficients
- Значения коэффициентовЭто свойство доступно только для чтения.
Значения коэффициентов, заданные как таблица. Coefficients
содержит по одной строке для каждого коэффициента и следующих столбцов:
Estimate
- Расчетное значение коэффициента
SE
- Стандартная ошибка оценки
tStat
- t -статистический для теста, что коэффициент равен нулю
pValue
- p -value для t -statistic
Использовать anova
(только для линейной регрессионой модели) или coefTest
для выполнения других тестов коэффициентов. Использовать coefCI
чтобы найти доверительные интервалы оценок коэффициентов.
Чтобы получить любой из этих столбцов в качестве вектора, индексируйте в свойство с помощью записи через точку. Для примера получите вектор оцененного коэффициента в модели mdl
:
beta = mdl.Coefficients.Estimate
Типы данных: table
NumCoefficients
- Количество коэффициентов моделиЭто свойство доступно только для чтения.
Количество коэффициентов модели, заданное как положительное целое число. NumCoefficients
включает коэффициенты, которые установлены в нуль, когда члены модели неполного ранга.
Типы данных: double
NumEstimatedCoefficients
- Количество расчетных коэффициентовЭто свойство доступно только для чтения.
Количество оцененных коэффициентов в модели, заданное в виде положительного целого числа. NumEstimatedCoefficients
не включает коэффициенты, которые равны нулю, когда члены модели неполного ранга. NumEstimatedCoefficients
- степени свободы для регрессии.
Типы данных: double
DFE
- Степени свободы для ошибкиЭто свойство доступно только для чтения.
Степени свободы для ошибки (невязки), равные количеству наблюдений минус количество оцененных коэффициентов, заданное в виде положительного целого числа.
Типы данных: double
LogLikelihood
- Логарифмическая правдоподобностьЭто свойство доступно только для чтения.
Логарифмическая правдоподобность значений отклика, заданная в виде числового значения, основанная на предположении, что каждое значение отклика следует нормальному распределению. Среднее значение нормального распределения является установленным (предсказанным) значением отклика, и отклонение является MSE
.
Типы данных: single
| double
ModelCriterion
- Критерий для сравнения моделейЭто свойство доступно только для чтения.
Критерий сравнения моделей, заданный как структура с этими полями:
AIC
- информационный критерий Акайке. AIC = –2*logL + 2*m
, где logL
- логарифмическая правдоподобность и m
- количество предполагаемых параметров.
AICc
- информационный критерий Akaike скорректирован для размера выборки. AICc = AIC + (2*m*(m + 1))/(n – m – 1)
, где n
количество наблюдений.
BIC
- байесовский информационный критерий. BIC = –2*logL + m*log(n)
.
CAIC
- Согласованный информационный критерий Акайке. CAIC = –2*logL + m*(log(n) + 1)
.
Информационные критерии являются инструментами выбора модели, которые можно использовать, чтобы сравнить несколько моделей, подгоняемых к одним и тем же данным. Эти критерии являются основанными на вероятностях показателями подгонки модели, которые включают штраф за сложность (в частности, количество параметров). Различные информационные критерии различаются формой штрафа.
Когда вы сравниваете несколько моделей, модель с самым низким значением информационного критерия является наиболее подходящей моделью. Наиболее подходящая модель может варьироваться в зависимости от критерия, используемого для сравнения модели.
Чтобы получить любое из значений критерия в виде скаляра, индексируйте в свойство с помощью записи через точку. Для примера получите значение AIC aic
в mdl модели
:
aic = mdl.ModelCriterion.AIC
Типы данных: struct
MSE
- Средняя квадратичная невязкаЭто свойство доступно только для чтения.
Средняя квадратичная невязка ( невязки), заданная в виде числового значения.
MSE = SSE / DFE,
где MSE - средняя квадратичная невязка, SSE - сумма квадратичных невязок, а DFE - степени свободы.
Типы данных: single
| double
RMSE
- Корневая средняя квадратичная невязкаЭто свойство доступно только для чтения.
Корневая средняя квадратичная невязка ( невязки), заданная в виде числового значения.
RMSE = sqrt (MSE),
где RMSE - корневая средняя квадратичная невязка, а MSE - средняя квадратичная невязка.
Типы данных: single
| double
Rsquared
- R-квадрат для моделиЭто свойство доступно только для чтения.
R-квадрат значения для модели, заданный как структура с двумя полями:
Ordinary
- Обыкновенный (нескорректированный) R-квадрат
Adjusted
- R-квадрат скорректирован для количества коэффициентов
R-квадратное значение является пропорцией общей суммы квадратов, объясненной моделью. Обыкновенное значение R-квадрат относится к SSR
и SST
свойства:
Rsquared = SSR/SST
,
где SST
- общая сумма квадратов, и SSR
- регрессионная сумма квадратов.
Для получения дополнительной информации смотрите Коэффициент детерминации (R-Квадрат).
Чтобы получить одно из этих значений в виде скаляра, индексируйте в свойство с помощью записи через точку. Для примера получите скорректированное значение R-квадрат в модели mdl
:
r2 = mdl.Rsquared.Adjusted
Типы данных: struct
SSE
- Сумма квадратов ошибокЭто свойство доступно только для чтения.
Сумма квадратичных невязок (остатков), заданная в виде числового значения.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
- общая сумма квадратов, SSE
- сумма квадратичных невязок, и SSR
- регрессионная сумма квадратов.
Типы данных: single
| double
SSR
- Регрессионная сумма квадратовЭто свойство доступно только для чтения.
Регрессионная сумма квадратов, заданная в виде числового значения. Регрессионная сумма квадратов равна сумме квадратов отклонений подобранных значений от их среднего.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
- общая сумма квадратов, SSE
- сумма квадратичных невязок, и SSR
- регрессионная сумма квадратов.
Типы данных: single
| double
SST
- Общая сумма квадратовЭто свойство доступно только для чтения.
Общая сумма квадратов, заданная в виде числового значения. Общая сумма квадратов равна сумме квадратов отклонений вектора отклика y
от mean(y)
.
Теорема Пифагора подразумевает
SST = SSE + SSR
,
где SST
- общая сумма квадратов, SSE
- сумма квадратичных невязок, и SSR
- регрессионная сумма квадратов.
Типы данных: single
| double
Robust
- Информация о надежной подгонкеЭто свойство доступно только для чтения.
Информация о надежной подгонке, заданная как структура с полями, описанными в этой таблице.
Область | Описание |
---|---|
WgtFun | Устойчивая функция взвешивания, такая как 'bisquare' (см. 'RobustOpts' ) |
Tune | Постоянная настройки. Это поле пустое ([] ), если WgtFun является 'ols' или если WgtFun - указатель на функцию для пользовательской весовой функции с константой настройки по умолчанию 1. |
Weights | Вектор весов, используемых в конечной итерации устойчивой подгонки. Это поле пустое для CompactLinearModel объект. |
Эта структура пуста, если вы не подбираете модель с помощью устойчивой регрессии.
Типы данных: struct
Formula
- Информация о моделиLinearFormula
объектЭто свойство доступно только для чтения.
Информация о модели, заданная как LinearFormula
объект.
Отобразите формулу подобранной модели mdl
использование записи через точку:
mdl.Formula
NumObservations
- Количество наблюденийЭто свойство доступно только для чтения.
Количество наблюдений функции аппроксимации, используемой в подборе кривой, заданное в виде положительного целого числа. NumObservations
- количество наблюдений, представленных в исходной таблице, наборе данных или матрице, минус любые исключенные строки (заданные с 'Exclude'
аргумент пары "имя-значение") или строки с отсутствующими значениями.
Типы данных: double
NumPredictors
- Количество переменных предиктораЭто свойство доступно только для чтения.
Количество переменных предиктора, используемых для подгонки модели, заданное в виде положительного целого числа.
Типы данных: double
NumVariables
- Количество переменныхЭто свойство доступно только для чтения.
Количество переменных во входных данных, заданное как положительное целое число. NumVariables
- количество переменных в исходной таблице или наборе данных или общее количество столбцов в матрице предиктора и векторе отклика.
NumVariables
также включает любые переменные, которые не используются для подгонки модели в качестве предикторов или в качестве отклика.
Типы данных: double
PredictorNames
- Имена предикторов, используемых для подгонки моделиЭто свойство доступно только для чтения.
Имена предикторов, используемых для подгонки модели, заданные как массив ячеек из векторов символов.
Типы данных: cell
ResponseName
- Имя переменной откликаЭто свойство доступно только для чтения.
Имя переменной отклика, заданное как вектор символов.
Типы данных: char
VariableInfo
- Информация о переменныхЭто свойство доступно только для чтения.
Информация о переменных, содержащихся в Variables
, заданная как таблица с одной строкой для каждой переменной и столбцами, описанными в этой таблице.
Столбец | Описание |
---|---|
Class | Класс переменной, заданный как массив ячеек из векторов символов, таких как 'double' и 'categorical' |
Range | Переменная область значений, заданная как массив ячеек из векторов
|
InModel | Индикатор того, какие переменные находятся в подобранной модели, заданный как логический вектор. Значение true если модель включает переменную. |
IsCategorical | Индикатор категориальных переменных, заданный как логический вектор. Значение true если переменная категориальна. |
VariableInfo
также включает любые переменные, которые не используются для подгонки модели в качестве предикторов или в качестве отклика.
Типы данных: table
VariableNames
- Имена переменныхЭто свойство доступно только для чтения.
Имена переменных, заданные как массив ячеек из векторов символов.
Если подгонка основана на таблице или наборе данных, это свойство задает имена переменных в таблице или наборе данных.
Если подгонка основана на матрице предиктора и векторе отклика, VariableNames
содержит значения, заданные в 'VarNames'
Аргумент пары "имя-значение" способа аппроксимации. Значение по умолчанию 'VarNames'
является {'x1','x2',...,'xn','y'}
.
VariableNames
также включает любые переменные, которые не используются для подгонки модели в качестве предикторов или в качестве отклика.
Типы данных: cell
anova | Анализ отклонения для линейной регрессионой модели |
coefCI | Доверительные интервалы оценок коэффициентов линейной регрессионой модели |
coefTest | Линейный тест гипотезы на коэффициентах линейной регрессионой модели |
partialDependence | Вычисление частичной зависимости |
plotEffects | Постройте графики основных эффектов предикторов в линейной регрессионой модели |
plotInteraction | Постройте эффекты взаимодействия двух предикторов в линейной регрессионой модели |
plotPartialDependence | Создайте график частичной зависимости (PDP) и отдельные графики условного ожидания (ICE) |
plotSlice | График срезов через установленную линейную регрессионую поверхность |
gather | Сбор свойств модели машинного обучения с графический процессор |
Подгонка линейной регрессионой модели к данным и уменьшение размера полной, подобранной линейной регрессионой модели путем отброса выборочных данных и некоторой информации, связанной с процессом подгонки.
Загрузите largedata4reg
набор данных, который содержит 15 000 наблюдений и 45 переменные.
load largedata4reg
Подбор линейной регрессионной модели к данным.
mdl = fitlm(X,Y);
Компактность модели.
compactMdl = compact(mdl);
Компактная модель отбрасывает исходные выборочные данные и некоторую информацию, связанную с процессом подгонки.
Сравните размер полной модели mdl
и компактную модель compactMdl
.
vars = whos('compactMdl','mdl'); [vars(1).bytes,vars(2).bytes]
ans = 1×2
81537 11408528
Компактная модель потребляет меньше памяти, чем полная модель.
Указания и ограничения по применению:
Для получения дополнительной информации смотрите Введение в генерацию кода.
Указания и ограничения по применению:
Следующие функции объекта полностью поддерживают массивы GPU:
Следующие функции объекта поддерживают объекты модели, оснащенные входными параметрами массива GPU:
Для получения дополнительной информации смотрите Запуск функций MATLAB на графическом процессоре (Parallel Computing Toolbox).
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.