Регрессия наименьших квадратов с недостающими данными
[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица A или массив ячеек, который обрабатывает две структуры модели:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является |
|
| |
где | |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значением по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3.... Сходимость принята когда оба |
| (Необязательно) |
| (Необязательно) Для вычислений метода взвешенных наименьших квадратов ковариации эта матрица соответствует весам для каждого ряда в регрессии. Матрица также служит исходным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM). |
| (Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:
|
[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat) оценивает модель регрессии наименьших квадратов с недостающими данными. Модель имеет форму
для выборок k = 1..., NUMSAMPLES.
ecmlsrmle оценивает NUMPARAMS- 1 вектор-столбец параметров модели под названием Parameters, и NUMSERIES- NUMSERIES матрица параметров ковариации под названием Covariance.
ecmlsrmle(Data, Design) без выходных аргументов строит функцию логарифмической правдоподобности для каждой итерации алгоритма.
Обобщать выходные параметры ecmlsrmle:
Parameters NUMPARAMS- 1 вектор-столбец оценок для параметров модели регрессии.
Covariance NUMSERIES- NUMSERIES матрица оценок для ковариации остаточных значений модели регрессии. Для моделей наименьших квадратов эта оценка не может быть оценкой наибольшего правдоподобия кроме при особых обстоятельствах.
Resid NUMSAMPLES- NUMSERIES матрица остаточных значений регрессии.
Другой выход, Info, структура, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:
Info.Obj — Вектор-столбец переменной степени, без больше, чем MaxIterations элементы, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj(end), терминальная оценка целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.
Info.PrevParameters — NUMPARAMS- 1 вектор-столбец оценок для параметров модели от итерации только до терминальной итерации.
Info.PrevCovariance — NUMSERIES- NUMSERIES матрица оценок для параметров ковариации от итерации только до терминальной итерации.
При выполнении метода взвешенных наименьших квадратов ковариации, Covar0 должна обычно быть диагональная матрица. Ряд с большим влиянием должен иметь меньшие диагональные элементы в Covar0 и ряд с меньшим влиянием должен иметь большие диагональные элементы. Обратите внимание на то, что при выполнении CWLS, Covar0 не должна быть диагональная матрица даже если CovarFormat = 'diagonal'.
Можно сконфигурировать Design как матрица, если NUMSERIES = 1 или как массив ячеек, если NUMSERIES≥ 1 .
Если Design массив ячеек и NUMSERIES= 1 , каждая ячейка содержит NUMPARAMS вектор-строка.
Если Design массив ячеек и NUMSERIES> 1 , каждая ячейка содержит NUMSERIES- NUMPARAMS матрица.
Эти замечания касаются как Design обрабатывает недостающие данные:
Несмотря на то, что Design не должен иметь NaN значения, проигнорированные выборки из-за NaN значения в Data также проигнорированы в соответствующем Design массив.
Если Design 1- 1 массив ячеек, который имеет один Design матрица для каждой выборки, никакого NaN значения разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES ≥ NUMPARAMS с rank(Design{1}) = NUMPARAMS.
ecmlsrmle более строго, чем mvnrmle о присутствии NaN значения в Design массив.
Используйте оценки в дополнительной структуре output Info в диагностических целях.
Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.
Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.
Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.
Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.
А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.