CompactLinearModel

Компактная модель линейной регрессии

Описание

CompactLinearModel компактная версия полного объекта модели линейной регрессии LinearModel. Поскольку компактная модель не хранит входные данные, используемые, чтобы подбирать модель или информацию, связанную с подходящим процессом, CompactLinearModel объект использует меньше памяти, чем LinearModel объект. Можно все еще использовать компактную модель, чтобы предсказать ответы с помощью новых входных данных, но некоторого LinearModel объектные функции не работают с компактной моделью.

Создание

Создайте CompactLinearModel модель от полного, обученного LinearModel модель при помощи compact.

Свойства

развернуть все

Содействующие оценки

`CoefficientCovariance` — Ковариационная матрица содействующих оценок
числовая матрица

Это свойство доступно только для чтения.

Ковариационная матрица коэффициента оценивает в виде p-by-p матрицу числовых значений. p является количеством коэффициентов в подобранной модели.

Для получения дополнительной информации смотрите Содействующие Стандартные погрешности и Доверительные интервалы.

Типы данных: single | double

`CoefficientNames` — Содействующие имена
массив ячеек из символьных векторов

Это свойство доступно только для чтения.

Коэффициент называет в виде массива ячеек из символьных векторов, каждый содержащий имя соответствующего термина.

Типы данных: cell

`Coefficients` — Содействующие значения
таблица

Это свойство доступно только для чтения.

Содействующие значения в виде таблицы. Coefficients содержит одну строку для каждого коэффициента и этих столбцов:

Estimate — Предполагаемое содействующее значение
SE — Стандартная погрешность оценки
tStat — t - статистическая величина для теста, что коэффициент является нулем
pValue — p - значение для t - статистическая величина

Используйте anova (только для модели линейной регрессии) или coefTest выполнять другие тесты на коэффициентах. Используйте coefCI найти доверительные интервалы содействующих оценок.

Чтобы получить любой из этих столбцов как вектор, индексируйте в свойство с помощью записи через точку. Например, получите предполагаемый вектор коэффициентов в модели mdl:

beta = mdl.Coefficients.Estimate

Типы данных: table

`NumCoefficients` — Количество коэффициентов модели
положительное целое число

Это свойство доступно только для чтения.

Количество коэффициентов модели в виде положительного целого числа. NumCoefficients включает коэффициенты, которые обнуляются, когда условия модели имеют неполный ранг.

Типы данных: double

`NumEstimatedCoefficients` — Количество предполагаемых коэффициентов
положительное целое число

Это свойство доступно только для чтения.

Количество предполагаемых коэффициентов в модели в виде положительного целого числа. NumEstimatedCoefficients не включает коэффициенты, которые обнуляются, когда условия модели имеют неполный ранг. NumEstimatedCoefficients степени свободы для регрессии.

Типы данных: double

Итоговая статистика

`DFE` — Степени свободы для ошибки
положительное целое число

Это свойство доступно только для чтения.

Степени свободы для ошибки (остаточные значения), равняйтесь количеству наблюдений минус количество предполагаемых коэффициентов в виде положительного целого числа.

Типы данных: double

`LogLikelihood` — Логарифмическая правдоподобность
числовое значение

Это свойство доступно только для чтения.

Логарифмическая правдоподобность значений ответа в виде числового значения, основанного на предположении, что каждое значение ответа следует за нормальным распределением. Среднее значение нормального распределения является подходящим (предсказанным) значением ответа, и отклонением является MSE.

Типы данных: single | double

`ModelCriterion` — Критерий сравнения модели
структура

Это свойство доступно только для чтения.

Критерий сравнения модели в виде структуры с этими полями:

AIC — Критерий информации о Akaike. AIC = –2*logL + 2*m, где logL логарифмическая правдоподобность и m количество предполагаемых параметров.
AICc — Критерий информации о Akaike откорректирован для объема выборки. AICc = AIC + (2*m*(m + 1))/(n – m – 1), где n количество наблюдений.
BIC — Байесов информационный критерий. BIC = –2*logL + m*log(n).
CAIC — Сопоставимый информационный критерий Akaike. CAIC = –2*logL + m*(log(n) + 1).

Информационные критерии являются инструментами выбора модели, которые можно использовать, чтобы сравнить подгонку многоуровневых моделей к тем же данным. Эти критерии являются основанными на вероятности мерами подгонки модели, которые включают штраф за сложность (а именно, количество параметров). Различные информационные критерии отличает форма штрафа.

Когда вы сравниваете многоуровневые модели, модель с самым низким информационным значением критерия является моделью оптимальной подгонки. Модель оптимальной подгонки может варьироваться в зависимости от критерия, используемого в сравнении модели.

Чтобы получить любое из значений критерия как скаляр, индексируйте в свойство с помощью записи через точку. Например, получите значение AIC aic в модели mdl:

aic = mdl.ModelCriterion.AIC

Типы данных: struct

`MSE` — Среднеквадратическая ошибка
числовое значение

Это свойство доступно только для чтения.

Среднеквадратическая ошибка (остаточные значения) в виде числового значения.

MSE = SSE / DFE,

где MSE является среднеквадратической ошибкой, SSE является суммой квадратичных невязок, и DFE является степенями свободы.

Типы данных: single | double

`RMSE` — Среднеквадратическая ошибка
числовое значение

Это свойство доступно только для чтения.

Среднеквадратическая ошибка (остаточные значения) в виде числового значения.

RMSE = sqrt (MSE),

где RMSE является среднеквадратической ошибкой, и MSE является среднеквадратической ошибкой.

Типы данных: single | double

`Rsquared` — Значение R-squared для модели
структура

Это свойство доступно только для чтения.

Значение R-squared для модели в виде структуры с двумя полями:

Ordinary — Обычный (неприспособленный) R-squared
Adjusted — R-squared, настроенный для количества коэффициентов

Значение R-squared является пропорцией полной суммы квадратов, объясненных моделью. Обычное значение R-squared относится к SSR и SST свойства:

Rsquared = SSR/SST,

где SST полная сумма квадратов и SSR сумма квадратов регрессии.

Для получения дополнительной информации смотрите Коэффициент детерминации (R-Squared).

Чтобы получить любое из этих значений как скаляр, индексируйте в свойство с помощью записи через точку. Например, получите настроенное значение R-squared в модели mdl:

r2 = mdl.Rsquared.Adjusted

Типы данных: struct

`SSE` — Сумма квадратичных невязок
числовое значение

Это свойство доступно только для чтения.

Сумма квадратичных невязок (остаточные значения) в виде числового значения.

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST полная сумма квадратов, SSE сумма квадратичных невязок и SSR сумма квадратов регрессии.

Типы данных: single | double

`SSR` — Сумма квадратов регрессии
числовое значение

Это свойство доступно только для чтения.

Сумма квадратов регрессии в виде числового значения. Сумма квадратов регрессии равна сумме отклонений в квадрате подходящих значений от их среднего значения.

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST полная сумма квадратов, SSE сумма квадратичных невязок и SSR сумма квадратов регрессии.

Типы данных: single | double

`SST` — Полная сумма квадратов
числовое значение

Это свойство доступно только для чтения.

Полная сумма квадратов в виде числового значения. Полная сумма квадратов равна сумме отклонений в квадрате вектора отклика y от mean(y).

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST полная сумма квадратов, SSE сумма квадратичных невязок и SSR сумма квадратов регрессии.

Типы данных: single | double

Подбор кривой методу

`Robust` — Устойчивая подходящая информация
структура

Это свойство доступно только для чтения.

Устойчивая подходящая информация в виде структуры с полями, описанными в этой таблице.

Поле	Описание
`WgtFun`	Устойчивая функция взвешивания, такая как `'bisquare'` (см. `'RobustOpts'`)
`Tune`	Постоянная настройка. Это поле пусто (`[]`) если `WgtFun` `'ols'` или если `WgtFun` указатель на функцию для пользовательской функции веса со значением по умолчанию, настраивающим постоянный 1.
`Weights`	Вектор весов используется в итоговой итерации устойчивой подгонки. Это поле пусто для `CompactLinearModel` объект.

Эта структура пуста, если вы не подбираете модель с помощью устойчивой регрессии.

Типы данных: struct

Входные данные

`Formula` — Информация модели
`LinearFormula` объект

Это свойство доступно только для чтения.

Информация модели в виде LinearFormula объект.

Отобразите формулу подобранной модели mdl использование записи через точку:

mdl.Formula

`NumObservations` — Количество наблюдений
положительное целое число

Это свойство доступно только для чтения.

Количество наблюдений подходящая функция используется в подборе кривой в виде положительного целого числа. NumObservations количество наблюдений, предоставленных в исходной таблице, наборе данных или матрице, минус любые исключенные строки (набор с 'Exclude' аргумент пары "имя-значение") или строки с отсутствующими значениями.

Типы данных: double

`NumPredictors` — Количество переменных предикторов
положительное целое число

Это свойство доступно только для чтения.

Количество переменных предикторов раньше подбирало модель в виде положительного целого числа.

Типы данных: double

`NumVariables` — Количество переменных
положительное целое число

Это свойство доступно только для чтения.

Количество переменных во входных данных в виде положительного целого числа. NumVariables количество переменных в исходной таблице или наборе данных или общем количестве столбцов в матрице предиктора и векторе отклика.

NumVariables также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.

Типы данных: double

`PredictorNames` — Имена предикторов раньше подбирали модель
массив ячеек из символьных векторов

Это свойство доступно только для чтения.

Имена предикторов раньше подбирали модель в виде массива ячеек из символьных векторов.

Типы данных: cell

`ResponseName` — Имя переменной отклика
символьный вектор

Это свойство доступно только для чтения.

Имя переменной отклика в виде вектора символов.

Типы данных: char

`VariableInfo` — Информация о переменных
таблица

Это свойство доступно только для чтения.

Информация о переменных содержится в VariablesВ виде таблицы с одной строкой для каждой переменной и столбцов, описанных в этой таблице.

Столбец	Описание
`Class`	Переменный класс в виде массива ячеек из символьных векторов, такого как `'double'` и `'categorical'`
`Range`	Переменный диапазон в виде массива ячеек векторов Непрерывная переменная — Двухэлементный вектор `[minMax ]`, минимальные и максимальные значения Категориальная переменная — Вектор отличных значений переменных
`InModel`	Индикатор которого переменные находятся в подобранной модели в виде логического вектора. Значением является `true` если модель включает переменную.
`IsCategorical`	Индикатор категориальных переменных в виде логического вектора. Значением является `true` если переменная является категориальной.

VariableInfo также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.

Типы данных: table

`VariableNames` — Имена переменных
массив ячеек из символьных векторов

Это свойство доступно только для чтения.

Имена переменных в виде массива ячеек из символьных векторов.

Если подгонка основана на таблице или наборе данных, это свойство обеспечивает имена переменных в таблице или наборе данных.
Если подгонка основана на матрице предиктора и векторе отклика, VariableNames содержит значения, заданные 'VarNames' аргумент пары "имя-значение" подходящего метода. Значение по умолчанию 'VarNames' {'x1','x2',...,'xn','y'}.

VariableNames также включает любые переменные, которые не используются, чтобы подбирать модель как предикторы или как ответ.

Типы данных: cell

Функции объекта

развернуть все

Предскажите ответы

`feval`	Предскажите ответы модели линейной регрессии использование входа того для каждого предиктора
`predict`	Предскажите ответы модели линейной регрессии
`random`	Симулируйте ответы со случайным шумом для модели линейной регрессии

Оцените линейную модель

`anova`	Дисперсионный анализ для модели линейной регрессии
`coefCI`	Доверительные интервалы содействующих оценок модели линейной регрессии
`coefTest`	Линейный тест гипотезы на коэффициентах модели линейной регрессии

Визуализируйте линейную модель

`plotEffects`	Постройте основные эффекты предикторов в модели линейной регрессии
`plotInteraction`	Постройте эффекты взаимодействия двух предикторов в модели линейной регрессии
`plotPartialDependence`	Создайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)
`plotSlice`	График срезов через подходящую поверхность линейной регрессии

Примеры

свернуть все

Компактная модель линейной регрессии

Скрипт Open Live Script

Подбирайте модель линейной регрессии к данным и уменьшайте размер полной, подбиравшей модели линейной регрессии путем отбрасывания выборочных данных и некоторой информации, связанной с подходящим процессом.

Загрузите largedata4reg набор данных, который содержит 15 000 наблюдений и 45 переменных предикторов.

load largedata4reg

Подбирайте модель линейной регрессии к данным.

mdl = fitlm(X,Y);

Уплотните модель.

compactMdl = compact(mdl);

Компактная модель отбрасывает исходные выборочные данные и некоторую информацию, связанную с подходящим процессом.

Сравните размер полной модели mdl и компактная модель compactMdl.

vars = whos('compactMdl','mdl');
[vars(1).bytes,vars(2).bytes]

ans = 1×2

       81538    11408530

Компактная модель использует меньше памяти, чем полная модель.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

predict и random функции поддерживают генерацию кода.
Когда вы подбираете модель при помощи fitlm или stepwiselm, вы не можете снабдить обучающими данными в таблице, которая содержит логический вектор, символьный массив, категориальный массив, массив строк или массив ячеек из символьных векторов. Кроме того, вы не можете использовать 'CategoricalVars' аргумент пары "имя-значение". Генерация кода не поддерживает категориальные предикторы. Чтобы включать категориальные предикторы в модель, предварительно обработайте категориальные предикторы при помощи dummyvar прежде, чем подбирать модель.

Для получения дополнительной информации смотрите Введение в Генерацию кода.

Документация

CompactLinearModel

Описание

Создание

Свойства

Содействующие оценки

CoefficientCovariance — Ковариационная матрица содействующих оценок числовая матрица

CoefficientNames — Содействующие имена массив ячеек из символьных векторов

Coefficients — Содействующие значения таблица

NumCoefficients — Количество коэффициентов модели положительное целое число

NumEstimatedCoefficients — Количество предполагаемых коэффициентов положительное целое число

Итоговая статистика

DFE — Степени свободы для ошибки положительное целое число

LogLikelihood — Логарифмическая правдоподобность числовое значение

ModelCriterion — Критерий сравнения модели структура

MSE — Среднеквадратическая ошибка числовое значение

RMSE — Среднеквадратическая ошибка числовое значение

Rsquared — Значение R-squared для модели структура

SSE — Сумма квадратичных невязок числовое значение

SSR — Сумма квадратов регрессии числовое значение

SST — Полная сумма квадратов числовое значение

Подбор кривой методу

Robust — Устойчивая подходящая информация структура

Входные данные

Formula — Информация модели LinearFormula объект

NumObservations — Количество наблюдений положительное целое число

NumPredictors — Количество переменных предикторов положительное целое число

NumVariables — Количество переменных положительное целое число

PredictorNames — Имена предикторов раньше подбирали модель массив ячеек из символьных векторов

ResponseName — Имя переменной отклика символьный вектор

VariableInfo — Информация о переменных таблица

VariableNames — Имена переменных массив ячеек из символьных векторов

Функции объекта

Предскажите ответы

Оцените линейную модель

Визуализируйте линейную модель

Примеры

Компактная модель линейной регрессии

Расширенные возможности

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Смотрите также

Темы

Введенный в R2016a

Документация Statistics and Machine Learning Toolbox

Поддержка

`CoefficientCovariance` — Ковариационная матрица содействующих оценок
числовая матрица

`CoefficientNames` — Содействующие имена
массив ячеек из символьных векторов

`Coefficients` — Содействующие значения
таблица

`NumCoefficients` — Количество коэффициентов модели
положительное целое число

`NumEstimatedCoefficients` — Количество предполагаемых коэффициентов
положительное целое число

`DFE` — Степени свободы для ошибки
положительное целое число

`LogLikelihood` — Логарифмическая правдоподобность
числовое значение

`ModelCriterion` — Критерий сравнения модели
структура

`MSE` — Среднеквадратическая ошибка
числовое значение

`RMSE` — Среднеквадратическая ошибка
числовое значение

`Rsquared` — Значение R-squared для модели
структура

`SSE` — Сумма квадратичных невязок
числовое значение

`SSR` — Сумма квадратов регрессии
числовое значение

`SST` — Полная сумма квадратов
числовое значение

`Robust` — Устойчивая подходящая информация
структура

`Formula` — Информация модели
`LinearFormula` объект

`NumObservations` — Количество наблюдений
положительное целое число

`NumPredictors` — Количество переменных предикторов
положительное целое число

`NumVariables` — Количество переменных
положительное целое число

`PredictorNames` — Имена предикторов раньше подбирали модель
массив ячеек из символьных векторов

`ResponseName` — Имя переменной отклика
символьный вектор

`VariableInfo` — Информация о переменных
таблица

`VariableNames` — Имена переменных
массив ячеек из символьных векторов

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.