Коэффициент детерминации (R-квадрат) указывает пропорциональное количество изменения переменной отклика y объясняемое независимыми переменными, X в линейной регрессионой модели. Чем больше R-квадрат, тем больше изменчивости объясняется линейной регрессионой модели.
R-квадрат - это пропорция общей суммы квадратов, объясненная моделью. Rsquared
свойство подобранной модели является структурой с двумя полями:
Ordinary
- Обыкновенный (нескорректированный) R-квадрат
Adjusted
- R-квадрат скорректирован для количества коэффициентов
SSE - сумма квадратичной невязки, SSR - сумма квадратной регрессии, SST - сумма квадратной суммы, n - количество наблюдений, а p - количество коэффициентов регрессии. Обратите внимание, что p включает в себя точку пересечения, поэтому, например, p является 2 для линейной подгонки. Поскольку R-квадрат увеличивается с добавлением переменных предиктора в регрессионой модели, скорректированный R-квадрат корректирует количество переменных предиктора в модели. Это делает его более полезным для сравнения моделей с другим количеством предикторов.
После получения подобранной модели, скажем mdl
, использование fitlm
или stepwiselm
можно получить любое значение R-квадрат в виде скаляра путем индексации в свойство с помощью записи через точку, например,
mdl.Rsquared.Ordinary mdl.Rsquared.Adjusted
Можно также получить SSE, SSR и SST с помощью свойств с таким же именем.
mdl.SSE mdl.SSR mdl.SST
В этом примере показано, как отобразить R-квадрат (коэффициент детерминации) и скорректированный R-квадрат. Загрузите выборочные данные и задайте ответ и независимые переменные.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
Подбор линейной регрессионой модели.
mdl = fitlm(X,y)
mdl = Linear regression model: y ~ 1 + x1 + x2 + x3 + x4 Estimated Coefficients: Estimate SE tStat pValue _________ ________ ________ __________ (Intercept) 117.4 5.2451 22.383 1.1667e-39 x1 0.88162 2.9473 0.29913 0.76549 x2 0.08602 0.06731 1.278 0.20438 x3 -0.016685 0.055714 -0.29947 0.76524 x4 9.884 1.0406 9.498 1.9546e-15 Number of observations: 100, Error degrees of freedom: 95 Root Mean Squared Error: 4.81 R-squared: 0.508, Adjusted R-Squared: 0.487 F-statistic vs. constant model: 24.5, p-value = 5.99e-14
Значения R-квадрат и скорректированные R-квадрат составляют 0,508 и 0,487, соответственно. Модель объясняет около 50% изменчивости переменной отклика.
Доступ к R-квадратным и скорректированным R-квадратным значениям с помощью свойства подобранного LinearModel
объект.
mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871
Скорректированное значение R-квадрат меньше обычного значения R-квадрат.
anova
| fitlm
| LinearModel
| stepwiselm