exponenta event banner

Матрица Hat и рычаги

Матрица шляпы

Цель

Матрица hat обеспечивает меру рычагов. Это полезно для исследования того, являются ли одно или несколько наблюдений выходящими относительно их значений X и, следовательно, могут чрезмерно влиять на результаты регрессии.

Определение

Матрица шляпы также известна как матрица проекции, потому что она проецирует вектор наблюдений, y, на вектор предсказаний, y ^, таким образом ставя «шляпу» на y. Головная матрица H определяется в терминах матрицы X данных:

H = X (XTX) -1XT

и определяет соответствующие или прогнозируемые значения с

y ^ = Hy = Xb.

Диагональные элементы H, hii, называются рычагами и удовлетворяют

0≤hii≤1∑i=1nhii=p,

где p - число коэффициентов, а n - число наблюдений (строк X) в регрессионной модели. HatMatrix является матрицей n-by-n в Diagnostics таблица.

Как сделать

После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:

  • Отображение HatMatrix индексированием в свойство с использованием точечной нотации

    mdl.Diagnostics.HatMatrix
    Когда n велик, HatMatrix может быть дорогостоящим в вычислительном отношении. В этих случаях значения диагонали можно получить непосредственно с помощью

    mdl.Diagnostics.Leverage

Рычаги

Цель

Леверидж - это мера влияния конкретного наблюдения на регрессионные прогнозы из-за положения этого наблюдения в пространстве входных данных. В общем, чем дальше точка от центра входного пространства, тем больше у нее рычагов. Поскольку сумма значений левериджа равна p, наблюдение i может рассматриваться как отклонение, если его леверидж существенно превышает среднее значение левериджа, p/n, например, значение больше 2 * p/n.

Определение

Рычагом i наблюдения является значение i-го диагонального члена, hii, матрицы шляпы, H, где

H = X (XTX) -1XT.

Диагональные члены удовлетворяют

0≤hii≤1∑i=1nhii=p,

где p - число коэффициентов в регрессионной модели, а n - число наблюдений. Минимальное значение hii равно 1/n для модели с постоянным членом. Если подогнанная модель проходит через начало координат, то минимальное значение рычага равно 0 для наблюдения при x = 0.

Можно выразить совпадающие значения, y ^, наблюдаемыми значениями, y, так как

y ^ = Hy = Xb.

Следовательно, hii выражает, насколько наблюдение yi оказывает влияние на y ^ i. Большое значение hii указывает, что i-й случай удален от центра всех значений X для всех n случаев и имеет больше рычагов.Leverage является вектором столбца n-by-1 в Diagnostics таблица.

Как сделать

После получения подогнанной модели, скажем, mdl, использование fitlm или stepwiselm, вы можете:

  • Отображение Leverage вектор путем индексирования в свойство с использованием точечной нотации

    mdl.Diagnostics.Leverage

  • Постройте график использования значений, установленных в модели, с помощью

    plotDiagnostics(mdl)
    См. раздел plotDiagnostics способ LinearModel для получения подробной информации.

Определение наблюдений с высоким уровнем эффективности

В этом примере показано, как вычислять Leverage значения и оценка наблюдений с высоким рычагом влияния. Загрузите образцы данных и определите ответ и независимые переменные.

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));

Подгонка модели линейной регрессии.

mdl = fitlm(X,y);

Постройте график значений рычагов.

plotDiagnostics(mdl)

Figure contains an axes. The axes with title Case order plot of leverage contains 2 objects of type line. These objects represent Leverage, Reference Line.

В этом примере рекомендуемое пороговое значение равно 2 * 5/100 = 0,1. Нет никаких признаков высокой эффективности наблюдений.

См. также

| | |

Связанные темы