Остатки полезны для обнаружения значений y и проверки предположений линейной регрессии относительно члена ошибки в регрессионной модели. Высокоэффективные наблюдения имеют меньшие остатки, потому что они часто смещают линию регрессии или поверхность ближе к ним. Можно также использовать остатки для обнаружения некоторых форм гетероскедастичности и автокорреляции.
Residuals матрица представляет собой таблицу n-на-4, содержащую четыре типа остатков, с одной строкой для каждого наблюдения.
Наблюдаемые минус подогнанные значения, то есть
y ^ .i
Необработанные остатки, деленные на среднеквадратичную ошибку, то есть
riMSE,
где ri - необработанный остаток, а MSE - среднеквадратичная ошибка.
Стандартизированные остатки являются необработанными остатками, деленными на их оценочное стандартное отклонение. Стандартизированный остаток для наблюдения i
hii),
где MSE - среднеквадратичная ошибка, а hii - значение рычага для наблюдения i.
Изученные остатки - это необработанные остатки, деленные на независимую оценку остаточного стандартного отклонения. Остаток для наблюдения i делится на оценку среднеквадратического отклонения погрешности на основе всех наблюдений, за исключением наблюдения i.
hii),
где MSE (i) является среднеквадратической ошибкой подгонки регресса, вычисленной, удаляя наблюдение i, и hii - стоимость рычагов для наблюдения i. У studentized остатка sri есть t-распределение с n - p - 1 степень свободы.
После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:
Найти Residuals таблица под mdl объект.
Получить любой из этих столбцов в виде вектора путем индексирования в свойство с помощью точечной нотации, например,
mdl.Residuals.Raw
Постройте график любых остатков для значений, соответствующих модели, используя
plotResiduals(mdl)
plotResiduals способ LinearModel класс.
В этом примере показано, как оценить предположения модели путем изучения остатков подогнанной модели линейной регрессии.
Загрузите образцы данных и сохраните независимые переменные и переменные ответа в таблице.
load imports-85 tbl = table(X(:,7),X(:,8),X(:,9),X(:,15),'VariableNames',... {'curb_weight','engine_size','bore','price'});
Подгонка модели линейной регрессии.
mdl = fitlm(tbl)
mdl =
Linear regression model:
price ~ 1 + curb_weight + engine_size + bore
Estimated Coefficients:
Estimate SE tStat pValue
__________ _________ _______ __________
(Intercept) 64.095 3.703 17.309 2.0481e-41
curb_weight -0.0086681 0.0011025 -7.8623 2.42e-13
engine_size -0.015806 0.013255 -1.1925 0.23452
bore -2.6998 1.3489 -2.0015 0.046711
Number of observations: 201, Error degrees of freedom: 197
Root Mean Squared Error: 3.95
R-squared: 0.674, Adjusted R-Squared: 0.669
F-statistic vs. constant model: 136, p-value = 1.14e-47
Постройте гистограмму необработанных остатков.
plotResiduals(mdl)

Гистограмма показывает, что остатки слегка скошены.
Постройте график всех четырех типов остатков.
Res = table2array(mdl.Residuals); boxplot(Res)

На рамочном графике также видна скошенная вправо структура остатков.
Постройте график нормальной вероятности необработанных остатков.
plotResiduals(mdl,'probability')
Этот график нормальной вероятности также показывает отклонение от нормальности и перекос на правом хвосте распределения остатков.
Постройте график между остатками и запаздывающими остатками.
plotResiduals(mdl,'lagged')
Этот график показывает тренд, который указывает возможную корреляцию между остатками. Вы можете дополнительно проверить это с помощью dwtest(mdl). Последовательная корреляция между остатками обычно означает, что модель может быть улучшена.
Постройте график симметрии остатков.
plotResiduals(mdl,'symmetry')
Этот график также предполагает, что остатки не распределены одинаково вокруг их медианы, как можно было бы ожидать для нормального распределения.
Постройте график остаточных значений по сравнению с подходящими значениями.
plotResiduals(mdl,'fitted')
Увеличение дисперсии по мере увеличения соответствующих значений предполагает возможную гетероскедастичность.
[1] Аткинсон, А. Т. Графики, преобразования и регрессия. Введение в графические методы диагностического регрессионного анализа. New York: Oxford Statistical Science Series, Oxford University Press, 1987.
[2] Нетер, Дж., М. Х. Кутнер, С. Дж. Нахтсхайм и В. Вассерман. Примененные линейные статистические модели. IRWIN, The McGraw-Hill Companies, Inc., 1996.
[3] Белсли, Д. А., Э. Кух и Р. Э. Уэлш. Регрессионная диагностика, выявление влиятельных данных и источников коллинеарности. Серия Уайли по вероятностной и математической статистике, John Wiley and Sons, Inc., 1980.
dwtest | fitlm | LinearModel | plotDiagnostics | plotResiduals | stepwiselm