Многомерная нормальная регрессия с недостающими данными
[Parameters,Covariance,Resid,Info] = ecmmvnrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица или массив ячеек, который обрабатывает две образцовых структуры:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является где |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значение по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3.... Сходимость принята, когда и |
| (Необязательно) |
| (Необязательно) |
| (Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:
|
[Parameters,Covariance,Resid,Info] = ecmmvnrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
оценивает многомерную нормальную модель регрессии с недостающими данными. Модель имеет форму
для выборок k = 1..., NUMSAMPLES
.
ecmmvnrmle
оценивает NUMPARAMS
-by-1
вектор-столбец параметров модели под названием Parameters
и NUMSERIES
-by-NUMSERIES
матрица параметров ковариации под названием Covariance
.
ecmmvnrmle(Data, Design)
без выходных аргументов строит логарифмическую функцию правдоподобия для каждой итерации алгоритма.
Обобщать выходные параметры ecmmvnrmle
:
Parameters
является NUMPARAMS
-by-1
вектор-столбец оценок для параметров модели регрессии.
Covariance
является NUMSERIES
-by-NUMSERIES
матрица оценок для ковариации невязок модели регрессии.
Resid
является NUMSAMPLES
-by-NUMSERIES
матрица невязок от регрессии. Для любых отсутствующих значений в Data
соответствующая невязка является различием между условно оценочным значением для Data
и моделью, то есть, оценочной невязкой.
Оценка ковариации Covariance
не может быть выведена от невязок.
Другой вывод, Info
, является структурой, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:
Info.Obj
— Вектор-столбец переменной степени, без больше, чем элементов MaxIterations
, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj
(end)
, является терминальной оценкой целевой функции. Если вы делаете оценку наибольшего правдоподобия, целевая функция является логарифмической функцией правдоподобия.
Info.PrevParameters
— NUMPARAMS
-by-1
вектор-столбец оценок для параметров модели от итерации только до терминальной итерации. nfo.PrevCovariance
– NUMSERIES
-by-NUMSERIES
матрица оценок для параметров ковариации от итерации только до терминальной итерации.
ecmmvnrmle
не принимает начальный вектор параметра, поскольку параметры оцениваются непосредственно от первой итерации вперед.
Можно сконфигурировать Design
как матрицу если NUMSERIES = 1
или как массив ячеек если NUMSERIES
≥ 1
.
Если Design
является массивом ячеек и NUMSERIES
= 1
, каждая ячейка содержит вектор - строку NUMPARAMS
.
Если Design
является массивом ячеек и NUMSERIES
> 1
, каждая ячейка содержит NUMSERIES
-by-NUMPARAMS
матрица.
Эти замечания касаются, как Design
обрабатывает недостающие данные:
Несмотря на то, что Design
не должен иметь значений NaN
, проигнорированные выборки из-за значений NaN
в Data
также проигнорированы в соответствующем массиве Design
.
Если Design
является 1
-by-1
массив ячеек, который имеет одну матрицу Design
для каждой выборки, никакие значения NaN
не разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES
≥ NUMPARAMS
с rank(Design{1}) = NUMPARAMS
.
ecmmvnrmle
более строг, чем mvnrmle
о присутствии значений NaN
в массиве Design
.
Используйте оценки в дополнительной выходной структуре Info
в диагностических целях.
Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.
Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.
Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.
Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.
А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.