Регрессия наименьших квадратов с недостающими данными
[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица A или массив ячеек, который обрабатывает две структуры модели:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является |
| |
где | |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значением по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3.... Сходимость принята когда оба |
| (Необязательно) |
| (Необязательно) Для вычислений метода взвешенных наименьших квадратов ковариации эта матрица соответствует весам для каждого ряда в регрессии. Матрица также служит исходным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM). |
| (Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:
|
[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat)
оценивает модель регрессии наименьших квадратов с недостающими данными. Модель имеет форму
для выборок k = 1..., NUMSAMPLES
.
ecmlsrmle
оценивает NUMPARAMS
- 1
вектор-столбец параметров модели под названием Parameters
, и NUMSERIES
- NUMSERIES
матрица параметров ковариации под названием Covariance
.
ecmlsrmle(Data, Design)
без выходных аргументов строит функцию логарифмической правдоподобности для каждой итерации алгоритма.
Обобщать выходные параметры ecmlsrmle
:
Parameters
NUMPARAMS
- 1
вектор-столбец оценок для параметров модели регрессии.
Covariance
NUMSERIES
- NUMSERIES
матрица оценок для ковариации остаточных значений модели регрессии. Для моделей наименьших квадратов эта оценка не может быть оценкой наибольшего правдоподобия кроме при особых обстоятельствах.
Resid
NUMSAMPLES
- NUMSERIES
матрица остаточных значений регрессии.
Другой выход, Info
, структура, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:
Info.Obj
— Вектор-столбец переменной степени, без больше, чем MaxIterations
элементы, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj
(end)
, терминальная оценка целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.
Info.PrevParameters
— NUMPARAMS
- 1
вектор-столбец оценок для параметров модели от итерации только до терминальной итерации.
Info.PrevCovariance
— NUMSERIES
- NUMSERIES
матрица оценок для параметров ковариации от итерации только до терминальной итерации.
При выполнении метода взвешенных наименьших квадратов ковариации, Covar0
должна обычно быть диагональная матрица. Ряд с большим влиянием должен иметь меньшие диагональные элементы в Covar0
и ряд с меньшим влиянием должен иметь большие диагональные элементы. Обратите внимание на то, что при выполнении CWLS, Covar0
не должна быть диагональная матрица даже если CovarFormat
= 'diagonal'
.
Можно сконфигурировать Design
как матрица, если NUMSERIES = 1
или как массив ячеек, если NUMSERIES
≥ 1 .
Если Design
массив ячеек и NUMSERIES
= 1 , каждая ячейка содержит
NUMPARAMS
вектор-строка.
Если Design
массив ячеек и NUMSERIES
> 1 , каждая ячейка содержит
NUMSERIES
- NUMPARAMS
матрица.
Эти замечания касаются как Design
обрабатывает недостающие данные:
Несмотря на то, что Design
не должен иметь NaN
значения, проигнорированные выборки из-за NaN
значения в Data
также проигнорированы в соответствующем Design
массив.
Если Design
1
- 1
массив ячеек, который имеет один Design
матрица для каждой выборки, никакого NaN
значения разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES
≥ NUMPARAMS
с rank(Design{1}) = NUMPARAMS
.
ecmlsrmle
более строго, чем mvnrmle
о присутствии NaN
значения в Design
массив.
Используйте оценки в дополнительной структуре output Info
в диагностических целях.
Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.
Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.
Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.
Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.
А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.