Коэффициент детерминации (R-Squared)

Цель

Коэффициент детерминации (R-squared) указывает на пропорциональный объем изменения переменной отклика y, объясненный независимыми переменными X в модели линейной регрессии. Чем больше R-squared, тем больше изменчивости объяснено моделью линейной регрессии.

Определение

R-squared является пропорцией полной суммы квадратов, объясненных моделью. Rsquared, свойство подобранной модели, структура с двумя полями:

  • Ordinary — Обычный (неприспособленный) R-squared

    R2=SSRSST=1SSESST.

  • Adjusted — R-squared, настроенный для количества коэффициентов

    Radj2=1(n1np)SSESST.

    SSE является суммой квадратичной невязки, SSR является суммой регрессии в квадрате, SST является суммой общего количества в квадрате, n является количеством наблюдений, и p является количеством коэффициентов регрессии. Обратите внимание на то, что p включает точку пересечения, так например, p 2 для линейной подгонки. Поскольку увеличения R-squared с добавленными переменными предикторами в модели регрессии, настроенный R-squared настраивает для количества переменных предикторов в модели. Это делает его более полезным для сравнения моделей с различным количеством предикторов.

Как к

После получения подобранной модели, скажем, mdl, использование fitlm или stepwiselm, можно получить любого значение R-squared как скаляр путем индексации в свойство с помощью записи через точку, например,

mdl.Rsquared.Ordinary
mdl.Rsquared.Adjusted

Можно также получить SSE, SSR и SST с помощью свойств с тем же именем.

mdl.SSE
mdl.SSR
mdl.SST

Отобразите коэффициент детерминации

В этом примере показано, как отобразить R-squared (коэффициент детерминации) и настроил R-squared. Загрузите выборочные данные и задайте переменные отклика и независимые переменные.

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));

Подбирайте модель линейной регрессии.

mdl = fitlm(X,y)
mdl = 
Linear regression model:
    y ~ 1 + x1 + x2 + x3 + x4

Estimated Coefficients:
                   Estimate        SE        tStat        pValue  
                   _________    ________    ________    __________

    (Intercept)        117.4      5.2451      22.383    1.1667e-39
    x1               0.88162      2.9473     0.29913       0.76549
    x2               0.08602     0.06731       1.278       0.20438
    x3             -0.016685    0.055714    -0.29947       0.76524
    x4                 9.884      1.0406       9.498    1.9546e-15


Number of observations: 100, Error degrees of freedom: 95
Root Mean Squared Error: 4.81
R-squared: 0.508,  Adjusted R-Squared: 0.487
F-statistic vs. constant model: 24.5, p-value = 5.99e-14

R-squared и настроенные значения R-squared 0.508 и 0.487, соответственно. Модель объясняет приблизительно 50% изменчивости в переменной отклика.

Доступ к R-squared и настроенным значениям R-squared с помощью свойства подходящего LinearModel объект.

mdl.Rsquared.Ordinary
ans = 0.5078
mdl.Rsquared.Adjusted
ans = 0.4871

Настроенное значение R-squared меньше, чем обычное значение R-squared.

Смотрите также

| | |

Похожие темы