Коэффициент детерминации (R-squared) указывает на пропорциональный объем изменения в переменной отклика y, объясненный независимыми переменными X в модели линейной регрессии. Чем больше R-squared, тем больше изменчивости объяснено моделью линейной регрессии.
R-squared является пропорцией полной суммы квадратов, объясненных моделью. Rsquared
, свойство подобранной модели, является структурой с двумя полями:
Ordinary
— Обычный (неприспособленный) R-squared
Adjusted
— R-squared, настроенный для количества коэффициентов
SSE является суммой квадратичной невязки, SSR является суммой регрессии в квадрате, SST является суммой общего количества в квадрате, n является количеством наблюдений, и p является количеством коэффициентов регрессии. Обратите внимание на то, что p включает прерывание, так например, p 2 для линейной подгонки. Поскольку увеличения R-squared с добавленными переменными прогноза в модели регрессии, настроенный R-squared настраивает для количества переменных прогноза в модели. Это делает его более полезным для сравнения моделей с различным количеством предикторов.
После получения подобранной модели, скажем, mdl
, с помощью fitlm
или stepwiselm
, можно получить любого значение R-squared как скаляр путем индексации в свойство с помощью записи через точку, например,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
Можно также получить SSE, SSR и SST с помощью свойств с тем же именем.
mdl.SSE mdl.SSR mdl.SST
Этот пример показывает, как отобразить R-squared (коэффициент детерминации) и настроил R-squared. Загрузите выборочные данные и задайте переменные отклика и независимые переменные.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
Соответствуйте модели линейной регрессии.
mdl = fitlm(X,y)
mdl = Linear regression model: y ~ 1 + x1 + x2 + x3 + x4 Estimated Coefficients: Estimate SE tStat pValue _________ ________ ________ __________ (Intercept) 117.4 5.2451 22.383 1.1667e-39 x1 0.88162 2.9473 0.29913 0.76549 x2 0.08602 0.06731 1.278 0.20438 x3 -0.016685 0.055714 -0.29947 0.76524 x4 9.884 1.0406 9.498 1.9546e-15 Number of observations: 100, Error degrees of freedom: 95 Root Mean Squared Error: 4.81 R-squared: 0.508, Adjusted R-Squared: 0.487 F-statistic vs. constant model: 24.5, p-value = 5.99e-14
R-squared и настроенные значения R-squared 0.508 и 0.487, соответственно. Модель объясняет приблизительно 50% изменчивости в переменной отклика.
Доступ к R-squared и настроенным значениям R-squared с помощью свойства подходящего объекта LinearModel
.
mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871
Настроенное значение R-squared меньше, чем обычное значение R-squared.
LinearModel
| anova
| fitlm
| stepwiselm