collintest

Диагностика коллинеарности Белсли

Синтаксис

collintest(X)

collintest(X,Name,Value)

sValue = collintest(___)

[sValue,condIdx,VarDecomp]
= collintest(___)

collintest(ax,___)

[sValue,condIdx,VarDecomp,h]
 = collintest(___)

Описание

пример

collintest(X) отображения диагностика коллинеарности Белсли для оценки силы и источников коллинеарности среди переменных в матрице или таблице X в командной строке.

пример

collintest(X,Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, collintest(X,'plot','on') строит результаты фигуре.

пример

sValue = collintest(___) возвращает сингулярные значения в порядке убывания с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах.

[sValue,condIdx,VarDecomp] = collintest(___) дополнительно возвращает индексы условия и пропорции разложения отклонения.

collintest(ax,___) графики на осях заданы ax вместо текущей системы координат (gca). ax может предшествовать любой из комбинаций входных аргументов в предыдущих синтаксисах.

[sValue,condIdx,VarDecomp,h] = collintest(___) дополнительно возвращает указатели на нанесенные на график графические объекты. Используйте элементы h изменить свойства графика после того, как вы создаете его.

Примеры

свернуть все

Отобразите диагностику коллинеарности Белсли

Скрипт Open Live Script

Отобразите диагностику коллинеарности для нескольких временных рядов.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Отобразите диагностику коллинеарности Белсли, с помощью всех опций по умолчанию.

collintest(DataTable)

Variance Decomposition

 sValue  condIdx   INF_C   INF_G   INT_S   INT_M   INT_L 
---------------------------------------------------------
 2.1748    1      0.0012  0.0018  0.0003  0.0000  0.0001 
 0.4789   4.5413  0.0261  0.0806  0.0035  0.0006  0.0012 
 0.1602  13.5795  0.3386  0.3802  0.0811  0.0011  0.0137 
 0.1211  17.9617  0.6138  0.5276  0.1918  0.0004  0.0193 
 0.0248  87.8245  0.0202  0.0099  0.7233  0.9979  0.9658

Только последняя строка в отображении имеет индекс условия, больше, чем допуск по умолчанию, 30. В этой строке последние три переменные (в последних трех столбцах) имеют пропорции разложения отклонения, превышающие допуск по умолчанию, 0.5. Это предполагает что переменные INT_S, INT_M, и INT_L покажите мультиколлинеарность.

Постройте диагностику коллинеарности Белсли

Скрипт Open Live Script

Постройте диагностику коллинеарности для нескольких временных рядов.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Постройте диагностику коллинеарности Белсли с помощью plot опция.

collintest(DataTable,'plot','on')

Variance Decomposition

 sValue  condIdx   INF_C   INF_G   INT_S   INT_M   INT_L 
---------------------------------------------------------
 2.1748    1      0.0012  0.0018  0.0003  0.0000  0.0001 
 0.4789   4.5413  0.0261  0.0806  0.0035  0.0006  0.0012 
 0.1602  13.5795  0.3386  0.3802  0.0811  0.0011  0.0137 
 0.1211  17.9617  0.6138  0.5276  0.1918  0.0004  0.0193 
 0.0248  87.8245  0.0202  0.0099  0.7233  0.9979  0.9658

$Figure contains an axes. The axes with title {\bf High Index Variance Decompositions} contains 3 objects of type line. These objects represent condIdx 87.8, tolProp.$

График соответствует значениям в последней строке пропорций разложения отклонения, которая является единственной с индексом условия, больше, чем допуск по умолчанию, 30. Последние три переменные в этой строке имеют пропорции разложения отклонения, превышающие допуск по умолчанию, 0.5, обозначенный красными маркерами в графике.

Возвратите диагностику коллинеарности Белсли

Скрипт Open Live Script

Вычислите диагностику коллинеарности для нескольких временных рядов и возвратите сингулярные значения, индексы условия и пропорции разложения отклонения.

Загрузите данные канадской инфляции и процентных ставок.

load Data_Canada

Вычислите диагностику коллинеарности Белсли. Выключите отображение результатов с помощью display опция.

[sv,conIdx,varDecomp] = collintest(DataTable,'display',...
    'off');

Нет никакого отображения результатов.

Отобразите содержимое varDecomp.

varDecomp

varDecomp = 5×5

    0.0012    0.0018    0.0003    0.0000    0.0001
    0.0261    0.0806    0.0035    0.0006    0.0012
    0.3386    0.3802    0.0811    0.0011    0.0137
    0.6138    0.5276    0.1918    0.0004    0.0193
    0.0202    0.0099    0.7233    0.9979    0.9658

Выходной аргумент varDecomp матрица пропорций разложения отклонения. sv вектор из сингулярных значений в порядке убывания и condIdx вектор из индексов условия в порядке возрастания.

Входные параметры

свернуть все

`X` — Введите переменные регрессии
числовая матрица | табличный массив

Введите переменные регрессии в виде numObs- numVars числовой матричный или табличный массив. Каждый столбец X соответствует переменной, и каждая строка соответствует наблюдению. Для моделей с точкой пересечения, X должен содержать столбец из единиц.

collintest масштабирует столбцы X к единичной длине перед обработкой. Данные в X не должен быть сосредоточен.

Если X табличный массив, затем переменные должны быть числовыми.

Типы данных: double | table

`ax` — Оси, на которых можно построить
`Axes` объект

Оси, на которых можно построить в виде Axes объект.

По умолчанию, collintest графики к текущей системе координат (gca).

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'plot','on','tolIdx',35 отображает график результатов с индексом допуска 35

`'varNames'` Имена переменных
представьте вектор в виде строки | вектор ячейки из строк

Имена переменных используются в отображениях и графиках результатов в виде разделенной запятой пары, состоящей из 'varNames' и вектор ячейки из строк или вектор строки. varNames должен иметь длину numVars, и каждая ячейка соответствует имени переменной. Если термин точки пересечения присутствует, то varNames должен включать термин точки пересечения (например, включать имя 'Const'). Программное обеспечение обрезает все имена переменных до первых пяти символов.

Если X матрица, затем значение по умолчанию varNames вектор ячейки из строк {'var1','var2',...}.
Если X табличный массив, затем значение по умолчанию varNames свойство X.Properties.VariableNames.

Пример: 'varNames',{'Const','AGE','BBD'}

Типы данных: cell | string

`'display'` — Отобразите индикатор результатов
`'on'` (значение по умолчанию) | `'off'`

Отобразите индикатор результатов для того, отобразить ли результаты в Командном окне в виде разделенной запятой пары, состоящей из 'display' и один из 'on' или 'off'. Если вы задаете значение 'on', затем все выводы отображены в табличной форме.

Пример: 'display','off'

Типы данных: cell | string

`'plot'` — Постройте индикатор результатов
`'off'` (значение по умолчанию) | `'on'`

Постройте индикатор результатов для того, построить ли результаты в виде разделенной запятой пары, состоящей из 'plot' и один из 'on' или 'off'.

Если вы задаете значение 'on', затем график показывает критические строки выхода VarDecomp, то есть, те строки с индексами условия выше входного допуска tolIdx.
Если у группы по крайней мере из двух переменных в критической строке есть пропорции разложения отклонения выше входного допуска tolProp, затем группа идентифицирована с красными маркерами.

Пример: 'plot','on'

Типы данных: cell | string

`'tolIdx'` — Допуск индекса условия
30 (значение по умолчанию) | скалярное значение по крайней мере 1

Допуск индекса условия в виде разделенной запятой пары, состоящей из 'tolIdx' и скалярное значение по крайней мере одного. collintest использует допуск, чтобы решить, какие индексы являются достаточно большими, чтобы вывести близкую зависимость в данных. tolIdx значение только используется когда plot имеет значение 'on'.

Пример: 'tolIdx',25

Типы данных: double

`'tolProp'` — Допуск пропорции разложения отклонения
0.5 (значение по умолчанию) | скаляр между 0 и 1

Допуск пропорции разложения отклонения в виде разделенной запятой пары, состоящей из 'tolProp' и скалярное значение между нулем и один. collintest использует допуск, чтобы решить, какие переменные вовлечены в любую близкую зависимость. tolProp значение только используется когда plot имеет значение 'on'.

Пример: 'tolProp',0.4

Типы данных: double

Выходные аргументы

свернуть все

`sValue` Сингулярные значения
вектор в порядке убывания

Сингулярные значения масштабированного X, возвращенный как вектор. Элементы sValue в порядке убывания.

`condIdx` — Индексы условия
вектор в порядке возрастания

Индексы условия, возвращенные как вектор с элементами в порядке возрастания. Все индексы условия имеют значение между одним и числом обусловленности масштабированного X. Большие индексы идентифицируют близкие зависимости среди переменных в X. Размер индексов является мерой того, как около зависимостей к коллинеарности.

`VarDecomp` — Пропорции разложения отклонения
матрица

Пропорции разложения отклонения, возвращенные как numVars- numVars матрица. Значительные доли, объединенные с большим индексом условия, идентифицируют группы переменных, вовлеченных в близкие зависимости. Размер пропорций является мерой того, как плохо регрессия ухудшается зависимостью.

`h` — Указатели на нанесенные на график графические объекты
графический массив

Указатели на нанесенные на график графические объекты, возвращенные как графический массив. h содержит уникальные идентификаторы графика, которые можно использовать, чтобы запросить или изменить свойства графика.

collintest графики, только если вы устанавливаете 'plot','on'.

Больше о

свернуть все

Диагностика коллинеарности Белсли

Belsley collinearity diagnostics оценивает силу и источники коллинеарности среди переменных в модели линейной регрессии кратного.

Чтобы оценить коллинеарность, программное обеспечение вычисляет сингулярные значения масштабированной переменной матрицы, X, и затем преобразует их в индексы условия. Условные индексы идентифицируют номер и силу любых близких зависимостей между переменными в переменной матрице. Программное обеспечение анализирует отклонение оценок обычных наименьших квадратов (OLS) коэффициентов регрессии в терминах сингулярных значений, чтобы идентифицировать переменные, вовлеченные в каждую близкую зависимость и степень, до которой зависимости ухудшают регрессию.

Индексы условия

condition indices для масштабированного матричного X идентифицирует номер и силу любых близких зависимостей в X.

Для масштабированного матричного X со столбцами p и сингулярными значениями $S_{1} \geq S_{2} \geq \dots \geq S_{p}$ , индексы условия столбцов X $S_{1} / S_{j},$ j = 1..., p.

Все индексы условия ограничены между одним и числом обусловленности.

Число обусловленности

condition number масштабированного матричного X является полной диагностикой для обнаружения коллинеарности.

Для масштабированного матричного X со столбцами p и сингулярными значениями $S_{1} \geq S_{2} \geq \dots \geq S_{p}$ , число обусловленности $S_{1} / S_{p} .$

Число обусловленности достигает своей нижней границы той, когда столбцы масштабированного X ортонормированы. Повышения числа обусловленности как варьируемые величины показывают большую зависимость.

Ограничение числа обусловленности как диагностика - то, что ему не удается обеспечить специфические особенности силы и источников любых близких зависимостей.

Модель многофакторной линейной регрессии

multiple linear regression model является моделью формы $Y = X β + ε .$ X является матрицей проекта переменных регрессии, и β является вектором из коэффициентов регрессии.

Сингулярные значения

singular values масштабированного матричного X является диагональными элементами матричного S в сингулярном разложении $U S V^{'} .$

В порядке убывания сингулярные значения масштабированного матричного X со столбцами p $S_{1} \geq S_{2} \geq \dots \geq S_{p}$ .

Пропорции разложения отклонения

Variance-decomposition proportions идентифицирует группы варьируемых величин, вовлеченных в близкие зависимости и степень, до которой зависимости ухудшают регрессию.

От сингулярного разложения $U S V^{'}$ из масштабированной матрицы проекта X (со столбцами p), позвольте:

V быть матрицей ортонормированных собственных векторов $X^{'} X$
$S_{1} \geq S_{2} \geq \dots \geq S_{p}$ будьте упорядоченными диагональными элементами матричного S

Отклонение оценки OLS коэффициента многофакторной линейной регрессии i, _βi, пропорционально сумме

$V {(i, 1)}^{2} / S_{1}^{2} + V {(i, 2)}^{2} / S_{2}^{2} + \dots + V {(i, p)}^{2} / S_{p}^{2},$

где $V (i, j)$ обозначает элемент (i, j) V.

Пропорция разложения отклонения (i, j) является пропорцией термина j в сумме относительно целой суммы, j = 1..., p.

Условия $S_{j}^{2}$ собственные значения масштабированных $X^{'} X$ . Таким образом большие пропорции разложения отклонения соответствуют маленьким собственным значениям $X^{'} X$ , общая диагностика для коллинеарности. Сингулярное разложение обеспечивает более прямое, численно устойчивое представление eigensystem масштабированных $X^{'} X$ .

Советы

В целях диагностики коллинеарности Белсли [1] показывает что масштабирование столбца матрицы проекта, X, всегда желательно. Однако он также показывает что, сосредотачивая данные в X нежелательный. Для моделей с точкой пересечения, если вы сосредотачиваете данные в X, затем роль постоянного термина в любой близкой зависимости скрыта, и выражения, вводящие в заблуждение диагностику.
Допуски к идентификации больших индексов условия и пропорций разложения отклонения сопоставимы с критическими значениями в стандартных тестах гипотезы. Опыт определяет самый полезный допуск, но эксперименты предлагают collintest значениями по умолчанию являются хорошие начальные точки [1].

Ссылки

[1] Белсли, D. A. Э. Кух и Р. Э. Уэлш. Диагностика регрессии. Нью-Йорк, Нью-Йорк: John Wiley & Sons, Inc., 1980.

[2] Судья, Г. Г., В. Э. Гриффитс, Р. К. Хилл, H. Lϋtkepohl и Т. К. Ли. Теория и практика эконометрики. Нью-Йорк, Нью-Йорк: John Wiley & Sons, Inc., 1985.

Смотрите также

corrplot

Представленный в R2012a

Документация

collintest

Синтаксис

Описание

Примеры

Отобразите диагностику коллинеарности Белсли

Постройте диагностику коллинеарности Белсли

Возвратите диагностику коллинеарности Белсли

Входные параметры

`X` — Введите переменные регрессии
числовая матрица | табличный массив

`ax` — Оси, на которых можно построить
`Axes` объект

Аргументы в виде пар имя-значение

`'varNames'` Имена переменных
представьте вектор в виде строки | вектор ячейки из строк

`'display'` — Отобразите индикатор результатов
`'on'` (значение по умолчанию) | `'off'`

`'plot'` — Постройте индикатор результатов
`'off'` (значение по умолчанию) | `'on'`

`'tolIdx'` — Допуск индекса условия
30 (значение по умолчанию) | скалярное значение по крайней мере 1

`'tolProp'` — Допуск пропорции разложения отклонения
0.5 (значение по умолчанию) | скаляр между 0 и 1

Выходные аргументы

`sValue` Сингулярные значения
вектор в порядке убывания

`condIdx` — Индексы условия
вектор в порядке возрастания

`VarDecomp` — Пропорции разложения отклонения
матрица

`h` — Указатели на нанесенные на график графические объекты
графический массив

Больше о

Диагностика коллинеарности Белсли

Индексы условия

Число обусловленности

Модель многофакторной линейной регрессии

Сингулярные значения

Пропорции разложения отклонения

Советы

Ссылки

Смотрите также

Документация Econometrics Toolbox

Поддержка

Документация

collintest

Синтаксис

Описание

Примеры

Отобразите диагностику коллинеарности Белсли

Постройте диагностику коллинеарности Белсли

Возвратите диагностику коллинеарности Белсли

Входные параметры

X — Введите переменные регрессии числовая матрица | табличный массив

ax — Оси, на которых можно построить Axes объект

Аргументы в виде пар имя-значение

'varNames' Имена переменных представьте вектор в виде строки | вектор ячейки из строк

'display' — Отобразите индикатор результатов 'on' (значение по умолчанию) | 'off'

'plot' — Постройте индикатор результатов 'off' (значение по умолчанию) | 'on'

'tolIdx' — Допуск индекса условия30 (значение по умолчанию) | скалярное значение по крайней мере 1

'tolProp' — Допуск пропорции разложения отклонения0.5 (значение по умолчанию) | скаляр между 0 и 1

Выходные аргументы

sValue Сингулярные значения вектор в порядке убывания

condIdx — Индексы условия вектор в порядке возрастания

VarDecomp — Пропорции разложения отклонения матрица

h — Указатели на нанесенные на график графические объекты графический массив

Больше о

Диагностика коллинеарности Белсли

Индексы условия

Число обусловленности

Модель многофакторной линейной регрессии

Сингулярные значения

Пропорции разложения отклонения

Советы

Ссылки

Смотрите также

Документация Econometrics Toolbox

Поддержка

`X` — Введите переменные регрессии
числовая матрица | табличный массив

`ax` — Оси, на которых можно построить
`Axes` объект

`'varNames'` Имена переменных
представьте вектор в виде строки | вектор ячейки из строк

`'display'` — Отобразите индикатор результатов
`'on'` (значение по умолчанию) | `'off'`

`'plot'` — Постройте индикатор результатов
`'off'` (значение по умолчанию) | `'on'`

`'tolIdx'` — Допуск индекса условия
30 (значение по умолчанию) | скалярное значение по крайней мере 1

`'tolProp'` — Допуск пропорции разложения отклонения
0.5 (значение по умолчанию) | скаляр между 0 и 1

`sValue` Сингулярные значения
вектор в порядке убывания

`condIdx` — Индексы условия
вектор в порядке возрастания

`VarDecomp` — Пропорции разложения отклонения
матрица

`h` — Указатели на нанесенные на график графические объекты
графический массив