Коэффициент детерминации (R-squared) указывает на пропорциональный объем изменения переменной отклика y, объясненный независимыми переменными X в модели линейной регрессии. Чем больше R-squared, тем больше изменчивости объяснено моделью линейной регрессии.
R-squared является пропорцией полной суммы квадратов, объясненных моделью. Rsquared, свойство подобранной модели, структура с двумя полями:
Ordinary — Обычный (неприспособленный) R-squared
Adjusted — R-squared, настроенный для количества коэффициентов
SSE является суммой квадратичной невязки, SSR является суммой регрессии в квадрате, SST является суммой общего количества в квадрате, n является количеством наблюдений, и p является количеством коэффициентов регрессии. Обратите внимание на то, что p включает точку пересечения, так например, p 2 для линейной подгонки. Поскольку увеличения R-squared с добавленными переменными предикторами в модели регрессии, настроенный R-squared настраивает для количества переменных предикторов в модели. Это делает его более полезным для сравнения моделей с различным количеством предикторов.
После получения подобранной модели, скажем, mdl, использование fitlm или stepwiselm, можно получить любого значение R-squared как скаляр путем индексации в свойство с помощью записи через точку, например,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
Можно также получить SSE, SSR и SST с помощью свойств с тем же именем.
mdl.SSE mdl.SSR mdl.SST
В этом примере показано, как отобразить R-squared (коэффициент детерминации) и настроил R-squared. Загрузите выборочные данные и задайте переменные отклика и независимые переменные.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));Подбирайте модель линейной регрессии.
mdl = fitlm(X,y)
mdl =
Linear regression model:
y ~ 1 + x1 + x2 + x3 + x4
Estimated Coefficients:
Estimate SE tStat pValue
_________ ________ ________ __________
(Intercept) 117.4 5.2451 22.383 1.1667e-39
x1 0.88162 2.9473 0.29913 0.76549
x2 0.08602 0.06731 1.278 0.20438
x3 -0.016685 0.055714 -0.29947 0.76524
x4 9.884 1.0406 9.498 1.9546e-15
Number of observations: 100, Error degrees of freedom: 95
Root Mean Squared Error: 4.81
R-squared: 0.508, Adjusted R-Squared: 0.487
F-statistic vs. constant model: 24.5, p-value = 5.99e-14
R-squared и настроенные значения R-squared 0.508 и 0.487, соответственно. Модель объясняет приблизительно 50% изменчивости в переменной отклика.
Доступ к R-squared и настроенным значениям R-squared с помощью свойства подходящего LinearModel объект.
mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871
Настроенное значение R-squared меньше, чем обычное значение R-squared.
LinearModel | fitlm | stepwiselm | anova