Матрица hat обеспечивает меру рычагов. Это полезно для исследования того, являются ли одно или несколько наблюдений выходящими относительно их значений X и, следовательно, могут чрезмерно влиять на результаты регрессии.
Матрица шляпы также известна как матрица проекции, потому что она проецирует вектор наблюдений, y, на вектор предсказаний, ^, таким образом ставя «шляпу» на y. Головная матрица H определяется в терминах матрицы X данных:
H = X (XTX) -1XT
и определяет соответствующие или прогнозируемые значения с
= Xb.
Диагональные элементы H, hii, называются рычагами и удовлетворяют
где p - число коэффициентов, а n - число наблюдений (строк X) в регрессионной модели. HatMatrix является матрицей n-by-n в Diagnostics таблица.
После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:
Отображение HatMatrix индексированием в свойство с использованием точечной нотации
mdl.Diagnostics.HatMatrix
HatMatrix может быть дорогостоящим в вычислительном отношении. В этих случаях значения диагонали можно получить непосредственно с помощью mdl.Diagnostics.Leverage
Леверидж - это мера влияния конкретного наблюдения на регрессионные прогнозы из-за положения этого наблюдения в пространстве входных данных. В общем, чем дальше точка от центра входного пространства, тем больше у нее рычагов. Поскольку сумма значений левериджа равна p, наблюдение i может рассматриваться как отклонение, если его леверидж существенно превышает среднее значение левериджа, p/n, например, значение больше 2 * p/n.
Рычагом i наблюдения является значение i-го диагонального члена, hii, матрицы шляпы, H, где
H = X (XTX) -1XT.
где p - число коэффициентов в регрессионной модели, а n - число наблюдений. Минимальное значение hii равно 1/n для модели с постоянным членом. Если подогнанная модель проходит через начало координат, то минимальное значение рычага равно 0 для наблюдения при x = 0.
Можно выразить совпадающие значения, ^, наблюдаемыми значениями, y, так как
= Xb.
Следовательно, hii выражает, насколько наблюдение yi оказывает влияние на i. Большое значение hii указывает, что i-й случай удален от центра всех значений X для всех n случаев и имеет больше рычагов.Leverage является вектором столбца n-by-1 в Diagnostics таблица.
После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:
Отображение Leverage вектор путем индексирования в свойство с использованием точечной нотации
mdl.Diagnostics.Leverage
Постройте график использования значений, установленных в модели, с помощью
plotDiagnostics(mdl)
plotDiagnostics способ LinearModel для получения подробной информации.
В этом примере показано, как вычислять Leverage значения и оценка наблюдений с высоким рычагом влияния. Загрузите образцы данных и определите ответ и независимые переменные.
load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));Подгонка модели линейной регрессии.
mdl = fitlm(X,y);
Постройте график значений рычагов.
plotDiagnostics(mdl)

В этом примере рекомендуемое пороговое значение равно 2 * 5/100 = 0,1. Нет никаких признаков высокой эффективности наблюдений.
fitlm | LinearModel | plotDiagnostics | stepwiselm