exponenta event banner

Остатки

Цель

Остатки полезны для обнаружения значений y и проверки предположений линейной регрессии относительно члена ошибки в регрессионной модели. Высокоэффективные наблюдения имеют меньшие остатки, потому что они часто смещают линию регрессии или поверхность ближе к ним. Можно также использовать остатки для обнаружения некоторых форм гетероскедастичности и автокорреляции.

Определение

Residuals матрица представляет собой таблицу n-на-4, содержащую четыре типа остатков, с одной строкой для каждого наблюдения.

Необработанные остатки

Наблюдаемые минус подогнанные значения, то есть

ri = yi y ^ .i

Остатки Пирсона

Необработанные остатки, деленные на среднеквадратичную ошибку, то есть

pri = riMSE,

где ri - необработанный остаток, а MSE - среднеквадратичная ошибка.

Стандартизированные остатки

Стандартизированные остатки являются необработанными остатками, деленными на их оценочное стандартное отклонение. Стандартизированный остаток для наблюдения i

sti = riMSE (1 hii),

где MSE - среднеквадратичная ошибка, а hii - значение рычага для наблюдения i.

Изученные остатки

Изученные остатки - это необработанные остатки, деленные на независимую оценку остаточного стандартного отклонения. Остаток для наблюдения i делится на оценку среднеквадратического отклонения погрешности на основе всех наблюдений, за исключением наблюдения i.

шри = riMSE (i) (1 hii),

где MSE (i) является среднеквадратической ошибкой подгонки регресса, вычисленной, удаляя наблюдение i, и hii - стоимость рычагов для наблюдения i. У studentized остатка sri есть t-распределение с n - p - 1 степень свободы.

Как сделать

После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:

  • Найти Residuals таблица под mdl объект.

  • Получить любой из этих столбцов в виде вектора путем индексирования в свойство с помощью точечной нотации, например,

    mdl.Residuals.Raw

  • Постройте график любых остатков для значений, соответствующих модели, используя

    plotResiduals(mdl)
    Для получения более подробной информации см. plotResiduals способ LinearModel класс.

Оценка предположений модели с использованием остатков

В этом примере показано, как оценить предположения модели путем изучения остатков подогнанной модели линейной регрессии.

Загрузите образцы данных и сохраните независимые переменные и переменные ответа в таблице.

 load imports-85
 tbl = table(X(:,7),X(:,8),X(:,9),X(:,15),'VariableNames',...
{'curb_weight','engine_size','bore','price'});

Подгонка модели линейной регрессии.

mdl = fitlm(tbl)
mdl = 
Linear regression model:
    price ~ 1 + curb_weight + engine_size + bore

Estimated Coefficients:
                    Estimate        SE         tStat       pValue  
                   __________    _________    _______    __________

    (Intercept)        64.095        3.703     17.309    2.0481e-41
    curb_weight    -0.0086681    0.0011025    -7.8623      2.42e-13
    engine_size     -0.015806     0.013255    -1.1925       0.23452
    bore              -2.6998       1.3489    -2.0015      0.046711


Number of observations: 201, Error degrees of freedom: 197
Root Mean Squared Error: 3.95
R-squared: 0.674,  Adjusted R-Squared: 0.669
F-statistic vs. constant model: 136, p-value = 1.14e-47

Постройте гистограмму необработанных остатков.

plotResiduals(mdl)

Figure contains an axes. The axes with title Histogram of residuals contains an object of type patch.

Гистограмма показывает, что остатки слегка скошены.

Постройте график всех четырех типов остатков.

 Res = table2array(mdl.Residuals);
 boxplot(Res)

Figure contains an axes. The axes contains 28 objects of type line.

На рамочном графике также видна скошенная вправо структура остатков.

Постройте график нормальной вероятности необработанных остатков.

plotResiduals(mdl,'probability')

Figure contains an axes. The axes with title Normal probability plot of residuals contains 2 objects of type line.

Этот график нормальной вероятности также показывает отклонение от нормальности и перекос на правом хвосте распределения остатков.

Постройте график между остатками и запаздывающими остатками.

plotResiduals(mdl,'lagged')

Figure contains an axes. The axes with title Plot of residuals vs. lagged residuals contains 3 objects of type line.

Этот график показывает тренд, который указывает возможную корреляцию между остатками. Вы можете дополнительно проверить это с помощью dwtest(mdl). Последовательная корреляция между остатками обычно означает, что модель может быть улучшена.

Постройте график симметрии остатков.

plotResiduals(mdl,'symmetry')

Figure contains an axes. The axes with title Symmetry plot of residuals around their median contains 2 objects of type line.

Этот график также предполагает, что остатки не распределены одинаково вокруг их медианы, как можно было бы ожидать для нормального распределения.

Постройте график остаточных значений по сравнению с подходящими значениями.

plotResiduals(mdl,'fitted')

Figure contains an axes. The axes with title Plot of residuals vs. fitted values contains 2 objects of type line.

Увеличение дисперсии по мере увеличения соответствующих значений предполагает возможную гетероскедастичность.

Ссылки

[1] Аткинсон, А. Т. Графики, преобразования и регрессия. Введение в графические методы диагностического регрессионного анализа. New York: Oxford Statistical Science Series, Oxford University Press, 1987.

[2] Нетер, Дж., М. Х. Кутнер, С. Дж. Нахтсхайм и В. Вассерман. Примененные линейные статистические модели. IRWIN, The McGraw-Hill Companies, Inc., 1996.

[3] Белсли, Д. А., Э. Кух и Р. Э. Уэлш. Регрессионная диагностика, выявление влиятельных данных и источников коллинеарности. Серия Уайли по вероятностной и математической статистике, John Wiley and Sons, Inc., 1980.

См. также

| | | | |

Связанные темы