При подгонке многомерных моделей линейной регрессии с использованием mvregress, можно использовать опциональную пару имя-значение 'algorithm','cwls' для выбора оценки наименьших квадратов. В этом случае по умолчанию mvregress возвращает оценки обыкновенных наименьших квадратов (OLS), используя Id. Кроме того, если для взвешивания задана ковариационная матрица, можно вернуть оценки наименьших квадратов (CWLS) с ковариационным взвешиванием. Если объединить OLS и CWLS, можно получить возможные обобщенные оценки наименьших квадратов (FGLS).
Оценка OLS для вектора коэффициентов является вектором , который минимизирует
− Xib).
Пусть обозначает вектор nd-by-1 сложенных d-мерных откликов, а обозначает матрицу nd-by-K сложенных конструктивных матриц. Вектор K-by-1 оценок коэффициента регрессии ОЛС равен
1X ′ y.
Это первый mvregress выход.
Данное Id ( значениеmvregress OLS по умолчанию), матрица дисперсии-ковариации оценок OLS
) − 1.
Это уже четвертый mvregress выход. Стандартные ошибки коэффициентов регрессии ОЛС являются квадратным корнем диагонали этой матрицы дисперсии-ковариации.
Если ваши данные не масштабированы таким образом, что start2Id, то вы можете умножить mvregress дисперсионно-ковариационная матрица на среднеквадратическую ошибку (MSE), несмещённую оценку Чтобы вычислить MSE, верните n-за-d матрицу остатков, (третий mvregress выход). Затем,
где Xiβ) ′ - i-я Е.
Для большинства многомерных проблем ковариационная матрица единичных ошибок недостаточна и приводит к неэффективным или смещенным стандартным оценкам ошибок. Можно указать матрицу для оценки CWLS, используя необязательный аргумент пары имя-значение covar0например, обратимая d-by-d матрица с именем . Обычно является диагональной матрицей, такой, что обратная матрица 1 содержит веса для каждой размерности для моделирования гетероскедастичности. Однако C0 также может быть недиагональной матрицей, моделирующей корреляцию.
Учитывая , решение CWLS является вектором , который минимизирует
− Xib).
В этом случае K-by-1 вектором оценок коэффициента регрессии CWLS является
In⊗C0) − 1y.
Это первый mvregress выход.
Если C0, это обобщённое решение наименьших квадратов (GLS). Соответствующая матрица дисперсии-ковариации оценок CWLS
1X) − 1.
Это уже четвертый mvregress выход. Стандартные ошибки коэффициентов регрессии CWLS являются квадратным корнем диагонали этой матрицы дисперсии-ковариации.
Если вы знаете только матрицу ковариации ошибок вплоть до пропорции, то есть σ2C0, вы можете умножить mvregress матрица дисперсии-ковариации MSE, как описано в Ordinary Least Squares.
Независимо от того, какой метод наименьших квадратов используется, оценка для матрицы дисперсия-ковариация ошибок равна
=E′En,
где - матрица остатков n-за-d. I-я строка равна Xib) ′.
Оценка ковариации погрешности, ^, является второйmvregress и матрица остатков является третьим выходом. Если указана дополнительная пара имя-значение 'covtype','diagonal', то mvregress возвращает ^ с нулями во внедиагональных записях,
Обобщенная оценка наименьших квадратов является оценкой CWLS с известной матрицей ковариации. То есть, при условии, известен, решение GLS является
(In⊗Σ) − 1y,
с матрицей дисперсии-ковариации
1X) − 1.
В большинстве случаев ковариация ошибок неизвестна. В осуществимой обобщенной оценке наименьших квадратов (FGLS) вместо Λ используется Λ ^. Двухшаговые оценки FGLS можно получить следующим образом:
Выполните регрессию OLS и верните оценку ^.
Выполните регрессию CWLS, используя Λ ^.
Можно также выполнять итерацию между этими двумя шагами до тех пор, пока не будет достигнута сходимость.
Для некоторых данных оценка OLS ^ является положительной полуопределённой, и не имеет уникальной обратной. В этом случае невозможно получить оценку FGLS с помощьюmvregress. В качестве альтернативы можно использовать lscov, которая использует обобщенную обратную для возврата взвешенных решений наименьших квадратов для положительных полуопределённых ковариационных матриц.
Альтернативой FGLS является использование оценок коэффициентов OLS (которые являются непротиворечивыми) и стандартная коррекция ошибок для повышения эффективности. Одной из таких стандартных корректировок ошибок, которая не требует инверсии ковариационной матрицы, является панельная коррекция стандартных ошибок (PCSE) [1]. Скорректированная панелью матрица дисперсии-ковариации для оценок ОЛС
(X ′ X) − 1.
PCSE являются квадратным корнем диагонали этой матрицы дисперсии-ковариации. Модель панели «Фиксированные эффекты» с параллельной корреляцией иллюстрирует вычисление PCSE.
Алгоритм оценки по умолчанию, используемый mvregress - оценка максимального правдоподобия (MLE). Функция логарифмирования для многомерной модели линейной регрессии
MLE для и являются значениями, которые максимизируют целевую функцию loglikeability.
mvregress находит MLE с помощью итеративного двухэтапного алгоритма. При итерации m + 1 оценки
′ (In⊗Σ (m)) − 1y
и
XibMLE (m + 1)) ′.
Алгоритм завершается, когда изменения в оценках коэффициентов и целевой функции логарифма меньше заданного допуска, или когда достигнуто заданное максимальное количество итераций. Необязательные аргументы пары имя-значение для изменения этих критериев сходимости: tolbeta, tolobj, и maxiterсоответственно.
Матрица дисперсии-ковариации MLE является необязательной mvregress выход. По умолчанию mvregress возвращает матрицу дисперсия-ковариация только для коэффициентов регрессии, но можно также получить матрицу дисперсия-ковариация, ^, используя опциональную пару имя-значение'vartype','full'. В этом случае mvregress возвращает матрицу дисперсии-ковариации для всех коэффициентов К регрессии, и d или d (d + 1 )/2 ковариационных членов (в зависимости от того, является ли ковариация ошибки диагональной или полной).
По умолчанию матрица дисперсии-ковариации является обратной наблюдаемой информационной матрицей Фишера ( 'hessian' опция). Вы можете запросить ожидаемую матрицу информации Фишера, используя опциональную пару имя-значение 'vartype','fisher'. При отсутствии отсутствующих данных ответа наблюдаемые и ожидаемые информационные матрицы Фишера одинаковы. Если данные ответа отсутствуют, наблюдаемая информация Фишера учитывает добавленную неопределенность из-за пропущенных значений, в то время как ожидаемая матрица информации Фишера этого не делает.
Матрица дисперсии-ковариации для коэффициента регрессии MLE равна
1X) − 1,
оценивается в MLE матрицы ковариации ошибок. Это уже четвертый mvregress выход. Стандартные ошибки MLE являются квадратным корнем диагонали этой матрицы дисперсии-ковариации.
Для ^ пусть λ обозначает вектор параметров в оценочной матрице дисперсия-ковариация погрешности. Например, если d = 2, то :
Если оценочная ковариационная матрица диагональна, то λ ^ 22).
Если оценочная ковариационная матрица заполнена, то 12, λ ^ 22).
Информационная матрица Фишера для
1,..., n
где - длина ( или d (d + 1 )/2). Результирующей матрицей дисперсии-ковариации является
) − 1.
При запросе матрицы полная дисперсия-ковариация mvregress возвращает (в качестве четвертого вывода) блок-диагональную матрицу
)).
Если какие-либо значения ответа отсутствуют, указывается NaN, mvregress использует алгоритм ожидания/условной максимизации (ECM) для оценки (при наличии достаточного количества данных). В этом случае алгоритм является итеративным как для наименьших квадратов, так и для оценки максимального правдоподобия. Во время каждой итерации mvregress вменяет отсутствующие значения ответа, используя их условное ожидание.
Рассмотрите возможность организации данных таким образом, чтобы совместное распределение отсутствующих и наблюдаемых ответов, обозначенных и соответственно, можно было записать как
)}.
Используя свойства многомерного нормального распределения, условное ожидание отсутствующих ответов с учетом наблюдаемых ответов
Xβ).
Кроме того, матрица дисперсии-ковариации условного распределения
=Σy˜−Σy˜yΣy−1Σyy˜.
При каждой итерации алгоритма ECM mvregress использует значения параметров из предыдущей итерации для:
Обновление коэффициентов регрессии с использованием комбинированного вектора наблюдаемых ответов и условных ожиданий отсутствующих ответов.
Обновите матрицу дисперсии-ковариации, скорректировав отсутствующие ответы, используя матрицу дисперсии-ковариации условного распределения.
Наконец, остатки, которые mvregress возвращаемые значения для отсутствующих ответов представляют собой разницу между условным ожиданием и подгоняемым значением, которые оба оцениваются в окончательных оценках параметров.
Если вы предпочитаете игнорировать любые наблюдения с отсутствующими значениями ответа, используйте пару имя-значение 'algorithm','mvn'. Обратите внимание, что mvregress всегда игнорирует наблюдения с отсутствующими предикторными значениями.
По умолчанию mvregress использует наблюдаемую информационную матрицу Фишера ( 'hessian' опция) для вычисления матрицы дисперсии-ковариации параметров регрессии. Это объясняет дополнительную неопределенность из-за отсутствующих значений ответа.
Наблюдаемая информационная матрица включает в себя вклады только наблюдаемых ответов. То есть наблюдаемая информационная матрица Фишера для параметров в матрице дисперсия-ковариация ошибок имеет элементы
.., n
где i - подмножество Λ ^, соответствующее наблюдаемым откликам yi.
Например, если d = 3, но отсутствует, то
Наблюдаемая информация Фишера для коэффициентов регрессии имеет аналогичные вклады от матриц конструкции и ковариации.
[1] Бек, Н. и Дж. Н. Кац. «Что делать (а не делать) с данными временных рядов и сечений в сравнительной политике». Обзор американских политических наук, том 89, № 3, стр. 634-647, 1995 год.