CompactLinearModel

Компактная модель линейной регрессии

Описание

CompactLinearModel является компактной версией полного объекта модели линейной регрессии LinearModel. Поскольку компактная модель не хранит входные данные, используемые, чтобы соответствовать модели или информации, связанной с подходящим процессом, объект CompactLinearModel использует меньше памяти, чем объект LinearModel. Можно все еще использовать компактную модель, чтобы предсказать ответы с помощью новых входных данных, но некоторые функции объекта LinearModel не работают с компактной моделью.

Создание

Создайте модель CompactLinearModel из полной, обученной модели LinearModel при помощи compact.

Свойства

развернуть все

Содействующие оценки

Это свойство доступно только для чтения.

Ковариационная матрица содействующих оценок, заданных как p-by-p матрица числовых значений. p является количеством коэффициентов в подобранной модели.

Для получения дополнительной информации смотрите Содействующие Стандартные погрешности и Доверительные интервалы.

Типы данных: single | double

Это свойство доступно только для чтения.

Содействующие имена, заданные как массив ячеек из символьных векторов, каждый содержащий имя соответствующего термина.

Типы данных: cell

Это свойство доступно только для чтения.

Содействующие значения, заданные как таблица. Coefficients содержит одну строку для каждого коэффициента и этих столбцов:

  • Estimate — Предполагаемое содействующее значение

  • SE — Стандартная погрешность оценки

  • tStatt - статистическая величина для теста, что коэффициент является нулем

  • pValuep - значение для t - статистическая величина

Используйте anova (только для модели линейной регрессии) или coefTest, чтобы выполнить другие тесты на коэффициентах. Используйте coefCI, чтобы найти доверительные интервалы содействующих оценок.

Чтобы получить любой из этих столбцов как вектор, индексируйте в свойство с помощью записи через точку. Например, получите предполагаемый вектор коэффициентов в модели mdl:

beta = mdl.Coefficients.Estimate

Типы данных: table

Это свойство доступно только для чтения.

Количество коэффициентов модели, заданных как положительное целое число. NumCoefficients включает коэффициенты, которые обнуляются, когда образцовые условия имеют неполный ранг.

Типы данных: double

Это свойство доступно только для чтения.

Количество предполагаемых коэффициентов в модели, заданной как положительное целое число. NumEstimatedCoefficients не включает коэффициенты, которые обнуляются, когда образцовые условия имеют неполный ранг. NumEstimatedCoefficients является степенями свободы для регрессии.

Типы данных: double

Итоговая статистика

Это свойство доступно только для чтения.

Степени свободы для ошибки (невязки), равняйтесь количеству наблюдений минус количество предполагаемых коэффициентов, заданных как положительное целое число.

Типы данных: double

Это свойство доступно только для чтения.

Loglikelihood значений ответа, заданных как числовое значение, основанное на предположении, что каждое значение ответа следует за нормальным распределением. Среднее значение нормального распределения является подходящим (предсказанным) значением ответа, и отклонением является MSE.

Типы данных: single | double

Это свойство доступно только для чтения.

Критерий образцового сравнения, заданного как структура с этими полями:

  • AIC — Критерий информации о Akaike.     AIC = –2*logL + 2*m, где logL является loglikelihood и m, является количеством предполагаемых параметров.

  • AICc — Критерий информации о Akaike исправляется для объема выборки.     AICc = AIC + (2*m*(m+1))/(n–m–1), где n является количеством наблюдений.

  • BIC — Байесов информационный критерий.     BIC = –2*logL + m*log(n).

  • CAIC — Сопоставимый информационный критерий Akaike.     CAIC = –2*logL + m*(log(n)+1).

Информационные критерии являются образцовыми инструментами выбора, которые можно использовать, чтобы сравнить подгонку многоуровневых моделей к тем же данным. Эти критерии являются основанными на вероятности мерами образцовой подгонки, которые включают штраф за сложность (а именно, количество параметров). Различные информационные критерии отличает форма штрафа.

Когда вы сравниваете многоуровневые модели, модель с самым низким информационным значением критерия является моделью оптимальной подгонки. Модель оптимальной подгонки может отличаться в зависимости от критерия, используемого для образцового сравнения.

Чтобы получить любое из значений критерия как скаляр, индексируйте в свойство с помощью записи через точку. Например, получите значение AIC aic в модели mdl:

aic = mdl.ModelCriterion.AIC

Типы данных: struct

Это свойство доступно только для чтения.

Среднеквадратическая ошибка (невязки), заданные как числовое значение.

MSE = SSE / DFE,

где MSE является среднеквадратической ошибкой, SSE является суммой квадратичных невязок, и DFE является степенями свободы.

Типы данных: single | double

Это свойство доступно только для чтения.

Среднеквадратическая ошибка (невязки), заданные как числовое значение.

RMSE = sqrt (MSE),

где RMSE является среднеквадратической ошибкой, и MSE является среднеквадратической ошибкой.

Типы данных: single | double

Это свойство доступно только для чтения.

Значение R-squared для модели, заданной как структура с двумя полями:

  • Ordinary — Обычный (неприспособленный) R-squared

  • Adjusted — R-squared, настроенный для количества коэффициентов

Значение R-squared является пропорцией полной суммы квадратов, объясненных моделью. Обычное значение R-squared относится к свойствам SSR и SST:

Rsquared = SSR/SST = 1 – SSE/SST,

где SST является полной суммой квадратов, SSE является суммой квадратичных невязок, и SSR является суммой квадратов регрессии.

Для получения дополнительной информации смотрите Коэффициент детерминации (R-Squared).

Чтобы получить любое из этих значений как скаляр, индексируйте в свойство с помощью записи через точку. Например, получите настроенное значение R-squared в модели mdl:

r2 = mdl.Rsquared.Adjusted

Типы данных: struct

Это свойство доступно только для чтения.

Сумма квадратичных невязок (невязки), заданные как числовое значение.

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST является полной суммой квадратов, SSE является суммой квадратичных невязок, и SSR является суммой квадратов регрессии.

Типы данных: single | double

Это свойство доступно только для чтения.

Сумма квадратов регрессии, заданная как числовое значение. Сумма квадратов регрессии равна сумме отклонений в квадрате подходящих значений от их среднего значения.

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST является полной суммой квадратов, SSE является суммой квадратичных невязок, и SSR является суммой квадратов регрессии.

Типы данных: single | double

Это свойство доступно только для чтения.

Полная сумма квадратов, заданных как числовое значение. Полная сумма квадратов равна сумме отклонений в квадрате вектора отклика y от mean(y).

Теорема Пифагора подразумевает

SST = SSE + SSR,

где SST является полной суммой квадратов, SSE является суммой квадратичных невязок, и SSR является суммой квадратов регрессии.

Типы данных: single | double

Подбор кривой методу

Это свойство доступно только для чтения.

Устойчивая подходящая информация, указанная как структура с полями, описанными в этой таблице.

Поле Описание
WgtFunУстойчивая функция взвешивания, такая как 'bisquare' (см. 'RobustOpts'),
TuneПостоянная настройка. Это поле пусто ([]), если WgtFun является 'ols' или если WgtFun является указателем на функцию для пользовательской функции веса со значением по умолчанию, настраивающим постоянный 1.
WeightsВектор весов используется в итоговой итерации устойчивой подгонки. Это поле пусто для объекта CompactLinearModel.

Эта структура пуста, если вы не соответствуете модели с помощью устойчивой регрессии.

Типы данных: struct

Входные данные

Это свойство доступно только для чтения.

Информация модели, указанная как объект LinearFormula.

Отобразите формулу подобранной модели mdl с помощью записи через точку:

mdl.Formula

Это свойство доступно только для чтения.

Количество наблюдений подходящая функция, используемая в подборе кривой, заданном как положительное целое число. NumObservations является количеством наблюдений, предоставленных в исходной таблице, наборе данных или матрице, минус любые исключенные строки (набор с аргументом пары "имя-значение" 'Exclude') или строки с отсутствующими значениями.

Типы данных: double

Это свойство доступно только для чтения.

Количество переменных прогноза раньше соответствовало модели, заданной как положительное целое число.

Типы данных: double

Это свойство доступно только для чтения.

Количество переменных во входных данных, заданных как положительное целое число. NumVariables является количеством переменных в исходной таблице или наборе данных или общем количестве столбцов в матрице предиктора и векторе отклика.

NumVariables также включает любые переменные, которые не используются, чтобы соответствовать модели как предикторам или как ответ.

Типы данных: double

Это свойство доступно только для чтения.

Имена предикторов раньше соответствовали модели, заданной как массив ячеек из символьных векторов.

Типы данных: cell

Это свойство доступно только для чтения.

Имя переменной отклика, заданное как вектор символов.

Типы данных: char

Это свойство доступно только для чтения.

Информация о переменных, содержимых в Variables, заданном как таблица с одной строкой для каждой переменной и столбцов, описана в этой таблице.

СтолбецОписание
ClassПеременный класс, заданный как массив ячеек из символьных векторов, такой как 'double' и 'categorical'
Range

Переменный диапазон, заданный как массив ячеек векторов

  • Непрерывная переменная — Двухэлементный векторный [min,max], минимальные и максимальные значения

  • Категориальная переменная — Вектор отличных значений переменных

InModelИндикатор которого переменные находятся в подобранной модели, заданной как логический вектор. Значением является true, если модель включает переменную.
IsCategoricalИндикатор категориальных переменных, заданных как логический вектор. Значением является true, если переменная является категориальной.

VariableInfo также включает любые переменные, которые не используются, чтобы соответствовать модели как предикторам или как ответ.

Типы данных: table

Это свойство доступно только для чтения.

Имена переменных, заданных как массив ячеек из символьных векторов.

  • Если подгонка основана на таблице или наборе данных, это свойство обеспечивает имена переменных в таблице или наборе данных.

  • Если подгонка основана на матрице предиктора и векторе отклика, VariableNames содержит значения, заданные аргументом пары "имя-значение" 'VarNames' подходящего метода. Значением по умолчанию 'VarNames' является {'x1','x2',...,'xn','y'}.

VariableNames также включает любые переменные, которые не используются, чтобы соответствовать модели как предикторам или как ответ.

Типы данных: cell

Функции объекта

развернуть все

fevalПредскажите ответы модели линейной регрессии использование входа того для каждого предиктора
predictПредскажите ответы модели линейной регрессии
randomМоделируйте ответы со случайным шумом для модели линейной регрессии
anovaДисперсионный анализ для модели линейной регрессии
coefCIДоверительные интервалы содействующих оценок модели линейной регрессии
coefTestЛинейный тест гипотезы на коэффициентах модели линейной регрессии
plotEffectsПостройте основные эффекты предикторов в модели линейной регрессии
plotInteractionПостройте эффекты взаимодействия двух предикторов в модели линейной регрессии
plotPartialDependenceСоздайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)
plotSliceГрафик срезов через подходящую поверхность линейной регрессии

Примеры

свернуть все

Соответствуйте модели линейной регрессии к данным и уменьшайте размер полной, подходящей модели линейной регрессии путем отбрасывания выборочных данных и некоторой информации, связанной с подходящим процессом.

Загрузите набор данных largedata4reg, который содержит 15 000 наблюдений и 45 переменных прогноза.

load largedata4reg

Соответствуйте модели линейной регрессии к данным.

mdl = fitlm(X,Y);

Уплотните модель.

compactMdl = compact(mdl);

Компактная модель отбрасывает исходные выборочные данные и некоторую информацию, связанную с подходящим процессом.

Сравните размер полной модели mdl и компактной модели compactMdl.

vars = whos('compactMdl','mdl');
[vars(1).bytes,vars(2).bytes]
ans = 1×2

       83506    11410618

Компактная модель использует меньше памяти, чем полная модель.

Расширенные возможности

Введенный в R2016a