Коэффициент определения (R-квадрат) указывает пропорциональную величину вариации в переменной ответа y, объясненной независимыми переменными X в модели линейной регрессии. Чем больше R-квадрат, тем больше вариабельность объясняется моделью линейной регрессии.
R-квадрат - доля общей суммы квадратов, объясняемая моделью. Rsquared, свойство подгоняемой модели, представляет собой структуру с двумя полями:
Ordinary - Обычный (нескорректированный) R-квадрат
SSESST.
Adjusted - R-квадрат, скорректированный на количество коэффициентов
) SSESST.
SSE - сумма квадратной ошибки, SSR - сумма квадратной регрессии, SST - сумма квадратной суммы, n - количество наблюдений, p - число коэффициентов регрессии. Следует отметить, что p включает в себя пересечение, так что, например, p равно 2 для линейной посадки. Поскольку R-квадрат увеличивается с добавлением переменных предиктора в регрессионной модели, скорректированный R-квадрат корректируется для количества переменных предиктора в модели. Это делает его более полезным для сравнения моделей с другим количеством предикторов.
После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, можно получить либо R-квадрат в качестве скаляра путем индексации в свойство с помощью точечной нотации, например,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
Можно также получить SSE, SSR и SST с помощью свойств с тем же именем.
mdl.SSE mdl.SSR mdl.SST
В этом примере показано, как отображать R-квадрат (коэффициент определения) и скорректированный R-квадрат. Загрузите образцы данных и определите ответ и независимые переменные.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));Подгонка модели линейной регрессии.
mdl = fitlm(X,y)
mdl =
Linear regression model:
y ~ 1 + x1 + x2 + x3 + x4
Estimated Coefficients:
Estimate SE tStat pValue
_________ ________ ________ __________
(Intercept) 117.4 5.2451 22.383 1.1667e-39
x1 0.88162 2.9473 0.29913 0.76549
x2 0.08602 0.06731 1.278 0.20438
x3 -0.016685 0.055714 -0.29947 0.76524
x4 9.884 1.0406 9.498 1.9546e-15
Number of observations: 100, Error degrees of freedom: 95
Root Mean Squared Error: 4.81
R-squared: 0.508, Adjusted R-Squared: 0.487
F-statistic vs. constant model: 24.5, p-value = 5.99e-14
Значения R-квадрата и скорректированного R-квадрата равны 0,508 и 0,487 соответственно. Модель объясняет около 50% изменчивости переменной отклика.
Доступ к R-квадратным и скорректированным R-квадратным значениям с использованием свойства установленного LinearModel объект.
mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871
Скорректированное значение R-квадрата меньше обычного значения R-квадрата.
anova | fitlm | LinearModel | stepwiselm