collintest

Диагностика коллинеарности Белсли

Описание

пример

collintest(X) отображения диагностика коллинеарности Белсли для оценки силы и источников коллинеарности среди переменных в матрице или таблице X в командной строке.

пример

collintest(X,Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, collintest(X,'plot','on') строит результаты фигуре.

пример

sValue = collintest(___) возвращает сингулярные значения в порядке убывания с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах.

[sValue,condIdx,VarDecomp] = collintest(___) дополнительно возвращает индексы условия и пропорции разложения отклонения.

collintest(ax,___) графики на осях заданы ax вместо текущей системы координат (gca). ax может предшествовать любой из комбинаций входных аргументов в предыдущих синтаксисах.

[sValue,condIdx,VarDecomp,h] = collintest(___) дополнительно возвращает указатели на нанесенные на график графические объекты. Используйте элементы h изменить свойства графика после того, как вы создаете его.

Примеры

свернуть все

Отобразите диагностику коллинеарности для нескольких временных рядов.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Отобразите диагностику коллинеарности Белсли, с помощью всех опций по умолчанию.

collintest(DataTable)
Variance Decomposition

 sValue  condIdx   INF_C   INF_G   INT_S   INT_M   INT_L 
---------------------------------------------------------
 2.1748    1      0.0012  0.0018  0.0003  0.0000  0.0001 
 0.4789   4.5413  0.0261  0.0806  0.0035  0.0006  0.0012 
 0.1602  13.5795  0.3386  0.3802  0.0811  0.0011  0.0137 
 0.1211  17.9617  0.6138  0.5276  0.1918  0.0004  0.0193 
 0.0248  87.8245  0.0202  0.0099  0.7233  0.9979  0.9658 

Только последняя строка в отображении имеет индекс условия, больше, чем допуск по умолчанию, 30. В этой строке последние три переменные (в последних трех столбцах) имеют пропорции разложения отклонения, превышающие допуск по умолчанию, 0.5. Это предполагает что переменные INT_S, INT_M, и INT_L покажите мультиколлинеарность.

Постройте диагностику коллинеарности для нескольких временных рядов.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Постройте диагностику коллинеарности Белсли с помощью plot опция.

collintest(DataTable,'plot','on')
Variance Decomposition

 sValue  condIdx   INF_C   INF_G   INT_S   INT_M   INT_L 
---------------------------------------------------------
 2.1748    1      0.0012  0.0018  0.0003  0.0000  0.0001 
 0.4789   4.5413  0.0261  0.0806  0.0035  0.0006  0.0012 
 0.1602  13.5795  0.3386  0.3802  0.0811  0.0011  0.0137 
 0.1211  17.9617  0.6138  0.5276  0.1918  0.0004  0.0193 
 0.0248  87.8245  0.0202  0.0099  0.7233  0.9979  0.9658 

Figure contains an axes object. The axes object with title blank H i g h blank I n d e x blank V a r i a n c e blank D e c o m p o s i t i o n s contains 3 objects of type line. These objects represent condIdx 87.8, tolProp.

График соответствует значениям в последней строке пропорций разложения отклонения, которая является единственной с индексом условия, больше, чем допуск по умолчанию, 30. Последние три переменные в этой строке имеют пропорции разложения отклонения, превышающие допуск по умолчанию, 0.5, обозначенный красными маркерами в графике.

Вычислите диагностику коллинеарности для нескольких временных рядов и возвратите сингулярные значения, индексы условия и пропорции разложения отклонения.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Вычислите диагностику коллинеарности Белсли. Выключите отображение результатов с помощью display опция.

[sv,conIdx,varDecomp] = collintest(DataTable,'display',...
    'off');

Нет никакого отображения результатов.

Отобразите содержимое varDecomp.

varDecomp
varDecomp = 5×5

    0.0012    0.0018    0.0003    0.0000    0.0001
    0.0261    0.0806    0.0035    0.0006    0.0012
    0.3386    0.3802    0.0811    0.0011    0.0137
    0.6138    0.5276    0.1918    0.0004    0.0193
    0.0202    0.0099    0.7233    0.9979    0.9658

Выходной аргумент varDecomp матрица пропорций разложения отклонения. sv вектор из сингулярных значений в порядке убывания и condIdx вектор из индексов условия в порядке возрастания.

Входные параметры

свернуть все

Введите переменные регрессии в виде numObs- numVars числовой матричный или табличный массив. Каждый столбец X соответствует переменной, и каждая строка соответствует наблюдению. Для моделей с точкой пересечения, X должен содержать столбец из единиц.

collintest масштабирует столбцы X к единичной длине перед обработкой. Данные в X не должен быть сосредоточен.

Если X табличный массив, затем переменные должны быть числовыми.

Типы данных: double | table

Оси, на которых можно построить в виде Axes объект.

По умолчанию, collintest графики к текущей системе координат (gca).

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'plot','on','tolIdx',35 отображает график результатов с индексом допуска 35

Имена переменных используются в отображениях и графиках результатов в виде разделенной запятой пары, состоящей из 'varNames' и вектор ячейки из строк или вектор строки. varNames должен иметь длину numVars, и каждая ячейка соответствует имени переменной. Если термин точки пересечения присутствует, то varNames должен включать термин точки пересечения (например, включать имя 'Const'). Программное обеспечение обрезает все имена переменных до первых пяти символов.

  • Если X матрица, затем значение по умолчанию varNames вектор ячейки из строк {'var1','var2',...}.

  • Если X табличный массив, затем значение по умолчанию varNames свойство X.Properties.VariableNames.

Пример: 'varNames',{'Const','AGE','BBD'}

Типы данных: cell | string

Отобразите индикатор результатов для того, отобразить ли результаты в Командном окне в виде разделенной запятой пары, состоящей из 'display' и один из 'on' или 'off'. Если вы задаете значение 'on', затем все выводы отображены в табличной форме.

Пример: 'display','off'

Типы данных: cell | string

Постройте индикатор результатов для того, построить ли результаты в виде разделенной запятой пары, состоящей из 'plot' и один из 'on' или 'off'.

  • Если вы задаете значение 'on', затем график показывает критические строки выхода VarDecomp, то есть, те строки с индексами условия выше входного допуска tolIdx.

  • Если у группы по крайней мере из двух переменных в критической строке есть пропорции разложения отклонения выше входного допуска tolProp, затем группа идентифицирована с красными маркерами.

Пример: 'plot','on'

Типы данных: cell | string

Допуск индекса условия в виде разделенной запятой пары, состоящей из 'tolIdx' и скалярное значение по крайней мере одного. collintest использует допуск, чтобы решить, какие индексы являются достаточно большими, чтобы вывести близкую зависимость в данных. tolIdx значение только используется когда plot имеет значение 'on'.

Пример: 'tolIdx',25

Типы данных: double

Допуск пропорции разложения отклонения в виде разделенной запятой пары, состоящей из 'tolProp' и скалярное значение между нулем и один. collintest использует допуск, чтобы решить, какие переменные вовлечены в любую близкую зависимость. tolProp значение только используется когда plot имеет значение 'on'.

Пример: 'tolProp',0.4

Типы данных: double

Выходные аргументы

свернуть все

Сингулярные значения масштабированного X, возвращенный как вектор. Элементы sValue в порядке убывания.

Индексы условия, возвращенные как вектор с элементами в порядке возрастания. Все индексы условия имеют значение между одним и числом обусловленности масштабированного X. Большие индексы идентифицируют близкие зависимости среди переменных в X. Размер индексов является мерой того, как около зависимостей к коллинеарности.

Пропорции разложения отклонения, возвращенные как numVars- numVars матрица. Значительные доли, объединенные с большим индексом условия, идентифицируют группы переменных, вовлеченных в близкие зависимости. Размер пропорций является мерой того, как плохо регрессия ухудшается зависимостью.

Указатели на нанесенные на график графические объекты, возвращенные как графический массив. h содержит уникальные идентификаторы графика, которые можно использовать, чтобы запросить или изменить свойства графика.

collintest графики, только если вы устанавливаете 'plot','on'.

Больше о

свернуть все

Диагностика коллинеарности Белсли

Belsley collinearity diagnostics оценивает силу и источники коллинеарности среди переменных в модели линейной регрессии кратного.

Чтобы оценить коллинеарность, программное обеспечение вычисляет сингулярные значения масштабированной переменной матрицы, X, и затем преобразует их в индексы условия. Условные индексы идентифицируют номер и силу любых близких зависимостей между переменными в переменной матрице. Программное обеспечение анализирует отклонение оценок обычных наименьших квадратов (OLS) коэффициентов регрессии в терминах сингулярных значений, чтобы идентифицировать переменные, вовлеченные в каждую близкую зависимость и степень, до которой зависимости ухудшают регрессию.

Индексы условия

condition indices для масштабированного матричного X идентифицирует номер и силу любых близких зависимостей в X.

Для масштабированного матричного X со столбцами p и сингулярными значениями S1S2Sp, индексы условия столбцов X S1/Sj, j = 1..., p.

Все индексы условия ограничены между одним и числом обусловленности.

Число обусловленности

condition number масштабированного матричного X является полной диагностикой для обнаружения коллинеарности.

Для масштабированного матричного X со столбцами p и сингулярными значениями S1S2Sp, число обусловленности S1/Sp.

Число обусловленности достигает своей нижней границы той, когда столбцы масштабированного X ортонормированы. Повышения числа обусловленности как варьируемые величины показывают большую зависимость.

Ограничение числа обусловленности как диагностика - то, что ему не удается обеспечить специфические особенности силы и источников любых близких зависимостей.

Модель многофакторной линейной регрессии

multiple linear regression model является моделью формы Y=Xβ+ε. X является матрицей проекта переменных регрессии, и β является вектором из коэффициентов регрессии.

Сингулярные значения

singular values масштабированного матричного X является диагональными элементами матричного S в сингулярном разложении USV.

В порядке убывания сингулярные значения масштабированного матричного X со столбцами p S1S2Sp.

Пропорции разложения отклонения

Variance-decomposition proportions идентифицирует группы варьируемых величин, вовлеченных в близкие зависимости и степень, до которой зависимости ухудшают регрессию.

От сингулярного разложения USV из масштабированной матрицы проекта X (со столбцами p), позвольте:

  • V быть матрицей ортонормированных собственных векторов XX

  • S1S2Sp будьте упорядоченными диагональными элементами матричного S

Отклонение оценки OLS коэффициента многофакторной линейной регрессии i, βi, пропорционально сумме

V(i,1)2/S12+V(i,2)2/S22++V(i,p)2/Sp2,

где V(i,j) обозначает элемент (i, j) V.

Пропорция разложения отклонения (i, j) является пропорцией термина j в сумме относительно целой суммы, j = 1..., p.

Термины Sj2 собственные значения масштабированных XX. Таким образом большие пропорции разложения отклонения соответствуют маленьким собственным значениям XX, общая диагностика для коллинеарности. Сингулярное разложение обеспечивает более прямое, численно устойчивое представление eigensystem масштабированных XX.

Советы

  • В целях диагностики коллинеарности Белсли [1] показывает что масштабирование столбца матрицы проекта, X, всегда желательно. Однако он также показывает что, сосредотачивая данные в X нежелательный. Для моделей с точкой пересечения, если вы сосредотачиваете данные в X, затем роль постоянного термина в любой близкой зависимости скрыта, и выражения, вводящие в заблуждение диагностику.

  • Допуски к идентификации больших индексов условия и пропорций разложения отклонения сопоставимы с критическими значениями в стандартных тестах гипотезы. Опыт определяет самый полезный допуск, но эксперименты предлагают collintest значениями по умолчанию являются хорошие начальные точки [1].

Ссылки

[1] Белсли, D. A. Э. Кух и Р. Э. Уэлш. Диагностика регрессии. Нью-Йорк, Нью-Йорк: John Wiley & Sons, Inc., 1980.

[2] Судья, Г. Г., В. Э. Гриффитс, Р. К. Хилл, H. Lϋtkepohl и Т. К. Ли. Теория и практика эконометрики. Нью-Йорк, Нью-Йорк: John Wiley & Sons, Inc., 1985.

Смотрите также

Представленный в R2012a