Когда вы подбираете многомерные линейные регрессионые модели с помощью mvregress
можно использовать опциональную пару "имя-значение" 'algorithm','cwls'
для выбора оценки методом наименьших квадратов. В этом случае по умолчанию mvregress
возвращает обычные оценки методом наименьших квадратов (OLS) с помощью . Кроме того, если вы задаете ковариационную матрицу для взвешивания, можно вернуть оценки наименьших квадратов (CWLS), взвешенные ковариацией. Если вы комбинируете OLS и CWLS, можно получить допустимые обобщенные оценки методом наименьших квадратов (FGLS).
Оценка OLS для вектора коэффициента является вектором который минимизирует
Давайте обозначает вектор nd -by-1 сложенных d -мерных откликов, и обозначить nd -by - K матрицу сложенных матриц проекта. Вектор K -by-1 оценок коэффициентов регрессии OLS,
Это первый mvregress
выход.
Данный (а mvregress
OLS по умолчанию), дисперсионно-ковариационная матрица оценок OLS является
Это четвёртая mvregress
выход. Стандартные ошибки коэффициентов регрессии OLS являются квадратным корнем диагонали этой дисперсионно-ковариационной матрицы.
Если ваши данные не масштабированы, что , тогда можно умножить mvregress
дисперсионно-ковариационная матрица средней квадратичной невязкой (MSE), объективная оценка . Чтобы вычислить MSE, верните n -by - d матрицу невязок, (третий mvregress
выход). Затем,
где - i-я строка .
Для большинства многомерных задач матрица тождеств ошибки ковариации является недостаточной и приводит к неэффективным или смещенным стандартным оценкам ошибки. Можно задать матрицу для оценки CWLS с помощью необязательного аргумента пары "имя-значение" covar0
например, матрица обратного d -by d с именем. Обычно, является диагональной матрицей, такой что обратная матрица содержит веса для каждой размерности, чтобы смоделировать гетероскедастичность. Однако, может также быть недиагональной матрицей, которая моделирует корреляцию.
Данный , решение CWLS является вектором который минимизирует
В этом случае вектор K -by-1 оценок коэффициента регрессии CWLS является
Это первый mvregress
выход.
Если , это обобщенное решение методом наименьших квадратов (GLS). Соответствующая дисперсионно-ковариационная матрица оценок CWLS
Это четвёртая mvregress
выход. Стандартные ошибки коэффициентов регрессии CWLS являются квадратным корнем диагонали этой дисперсионно-ковариационной матрицы.
Если вы знаете только ковариационную матрицу ошибок до пропорции, то есть , можно умножить mvregress
дисперсионно-ковариационная матрица MSE, как описано в «Обыкновенных наименьших квадратах».
Независимо от того, какой метод наименьших квадратов вы используете, оценка для дисперсионно-ковариационной матрицы ошибки является
где - n -by - d матрица невязок. Вторая i строка является
Ковариационная оценка ошибки, , является вторым mvregress
выход, и матрица невязок, , - третий выход. Если вы задаете необязательную пару "имя-значение" 'covtype','diagonal'
, затем mvregress
возвраты с нулями в недиагональных записях,
Обобщенная оценка методом наименьших квадратов является оценкой CWLS с известной ковариационной матрицей. То есть, дано известно, что решение GLS является
с дисперсионно-ковариационной матрицей
В большинстве случаев ковариация ошибок неизвестна. Допустимая обобщенная оценка методом наименьших квадратов (FGLS) использует вместо . Можно получить двухэтапные оценки FGLS следующим образом:
Выполните регрессию OLS и верните оценку .
Выполните регрессию CWLS, используя .
Можно также выполнить итерацию между этими двумя шагами до достижения сходимости.
Для некоторых данных оценка OLS положительный полуопределенный, и не имеет уникальной обратной. В этом случае вы не можете получить оценку FGLS с помощью mvregress
. В качестве альтернативы можно использовать lscov
, который использует обобщенную обратную матрицу, чтобы вернуть взвешенные решения методом наименьших квадратов для положительных полуопределенных ковариационных матриц.
Альтернативой FGLS является использование оценок коэффициентов OLS (которые являются последовательными) и стандартная коррекция ошибок для повышения эффективности. Одной из таких стандартных корректировок ошибок - которая не требует инверсии ковариационной матрицы - являются стандартные ошибки с панельной коррекцией (PCSE) [1]. Панель скорректированная дисперсионно-ковариационная матрица для оценок OLS
PCSE являются квадратным корнем диагонали этой дисперсионно-ковариационной матрицы. Модель панели фиксированных эффектов с параллельной корреляцией иллюстрирует расчеты PCSE.
Алгоритм оценки по умолчанию, используемый mvregress
- максимальная оценка правдоподобия (MLE). Логарифмическая правдоподобность для многомерной модели линейной регрессии
MLE для и являются значениями, которые максимизируют целевую функцию логарифмической правдоподобности.
mvregress
находит MLE с помощью итерационного двухэтапного алгоритма. При итерации m + 1 оценки
и
Алгоритм заканчивается, когда изменения в оценках коэффициентов и целевой функции логарифмической правдоподобности меньше заданного допуска, или когда достигается заданное максимальное количество итераций. Необязательные аргументы пары "имя-значение" для изменения этих критериев сходимости tolbeta
, tolobj
, и maxiter
, соответственно.
Дисперсионно-ковариационная матрица MLE является необязательной mvregress
выход. По умолчанию mvregress
возвращает дисперсионно-ковариационную матрицу только для коэффициентов регрессии, но можно также получить дисперсионно-ковариационную матрицу использование опциональной пары "имя-значение" 'vartype','full'
. В этом случае mvregress
возвращает дисперсионно-ковариационную матрицу для всех коэффициентов регрессии K и d или d (d + 1 )/2 ковариационных членов (в зависимости от того, является ли ковариация ошибки диагональной или полной).
По умолчанию дисперсионно-ковариационная матрица является обратной наблюдаемой информационной матрицы Фишера ('hessian'
опция). Можно запросить ожидаемую информационную матрицу Фишера, используя опциональную пару "имя-значение" 'vartype','fisher'
. При условии отсутствия отсутствующих данных отклика наблюдаемые и ожидаемые информационные матрицы Фишера одинаковы. Если данные отклика отсутствуют, наблюдаемая информация Фишера учитывает добавленную неопределенность из-за отсутствующих значений, в то время как ожидаемая информационная матрица Фишера нет.
Дисперсионно-ковариационная матрица для MLE коэффициента регрессии
оценивается в MLE ковариационной матрицы ошибки. Это четвёртая mvregress
выход. Стандартные ошибки MLE являются квадратным корнем диагонали этой дисперсионно-ковариационной матрицы.
Для Давайте обозначить вектор параметров в оценочной дисперсионно-ковариационной матрице ошибок. Для примера, если d = 2, то:
Если предполагаемая ковариационная матрица диагональна, то .
Если предполагаемая ковариационная матрица полна, то .
Информационная матрица Фишера для , , имеет элементы
где - длина, (либо d, либо d (d + 1 )/2). Получившаяся дисперсионно-ковариационная матрица
Когда вы запрашиваете полную дисперсионно-ковариационную матрицу, mvregress
Возвраты (как четвертый выход) матрицу блока диагонали
Если какие-либо значения отклика отсутствуют, обозначены NaN
, mvregress
использует алгоритм максимизации ожиданий/условной максимизации (ECM) для оценки (если достаточно данных доступно). В этом случае алгоритм итеративен как для наименьших квадратов, так и для максимальной оценки правдоподобия. Во время каждой итерации mvregress
вписывает отсутствующие значения отклика, используя их условное ожидание.
Рассмотрите организацию данных так, чтобы совместное распределение отсутствующих и наблюдаемых ответов, обозначенных и соответственно может быть записано как
Используя свойства многомерного нормального распределения, условное ожидание отсутствующих ответов, учитывая наблюдаемые ответы,
Кроме того, дисперсионно-ковариационная матрица условного распределения
При каждой итерации алгоритма ECM, mvregress
использует значения параметров из предыдущей итерации в:
Обновите коэффициенты регрессии, используя объединенный вектор наблюдаемых ответов и условных ожиданий отсутствующих ответов.
Обновите дисперсионно-ковариационную матрицу с поправкой на отсутствующие ответы с помощью дисперсионно-ковариационной матрицы условного распределения.
Наконец, невязки, которые mvregress
возвраты для отсутствующих ответов являются различием между условным ожиданием и подобранным значением, оба оцениваются при окончательных оценках параметра.
Если вы предпочитаете игнорировать любые наблюдения, которые имеют отсутствующие значения отклика, используйте пару "имя-значение" 'algorithm','mvn'
. Обратите внимание, что mvregress
всегда игнорирует наблюдения, которые имеют отсутствующие значения предиктора.
По умолчанию mvregress
использует наблюдаемую информационную матрицу Фишера ('hessian'
опция), чтобы вычислить дисперсионно-ковариационную матрицу параметров регрессии. Это учитывает дополнительную неопределенность из-за отсутствующих значений отклика.
Наблюдаемая информационная матрица включает вклады только из наблюдаемых ответов. То есть наблюдаемая информационная матрица Фишера для параметров в ошибку дисперсионно-ковариационной матрице имеет элементы
где является подмножеством соответствующий наблюдаемым реакциям в
Для примера, если d = 3, но отсутствует, тогда
Наблюдаемая информация Фишера для коэффициентов регрессии имеет аналогичные вклады от проекта и ковариационных матриц.
[1] Бек, Н. и Дж. Н. Кац. «Что делать (и не делать) с данными поперечного сечения временных рядов в сравнительной политике». American Politicy Science Review, Vol. 89, No. 3, pp. 634-647, 1995.