Регрессия наименьших квадратов с недостающими данными
[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица или массив ячеек, который обрабатывает две образцовых структуры:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является |
| |
где | |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значение по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3.... Сходимость принята, когда и |
| (Необязательно) |
| (Необязательно) Для вычислений метода взвешенных наименьших квадратов ковариации эта матрица соответствует весам для каждого ряда в регрессии. Матрица также служит исходным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM). |
| (Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:
|
[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat)
оценивает модель регрессии наименьших квадратов с недостающими данными. Модель имеет форму
для выборок k = 1..., NUMSAMPLES
.
ecmlsrmle
оценивает NUMPARAMS
-by-1
вектор-столбец параметров модели под названием Parameters
и NUMSERIES
-by-NUMSERIES
матрица параметров ковариации под названием Covariance
.
ecmlsrmle(Data, Design)
без выходных аргументов строит логарифмическую функцию правдоподобия для каждой итерации алгоритма.
Обобщать выходные параметры ecmlsrmle
:
Parameters
является NUMPARAMS
-by-1
вектор-столбец оценок для параметров модели регрессии.
Covariance
является NUMSERIES
-by-NUMSERIES
матрица оценок для ковариации невязок модели регрессии. Для моделей наименьших квадратов эта оценка не может быть оценкой наибольшего правдоподобия кроме при особых обстоятельствах.
Resid
является NUMSAMPLES
-by-NUMSERIES
матрица невязок от регрессии.
Другой вывод, Info
, является структурой, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:
Info.Obj
— Вектор-столбец переменной степени, без больше, чем элементов MaxIterations
, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj
(end)
, является терминальной оценкой целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.
Info.PrevParameters
— NUMPARAMS
-by-1
вектор-столбец оценок для параметров модели от итерации только до терминальной итерации.
Info.PrevCovariance
— NUMSERIES
-by-NUMSERIES
матрица оценок для параметров ковариации от итерации только до терминальной итерации.
При выполнении метода взвешенных наименьших квадратов ковариации Covar0
должен обычно быть диагональной матрицей. Ряд с большим влиянием должен иметь меньшие диагональные элементы в Covar0
, и ряд с меньшим влиянием должен иметь большие диагональные элементы. Обратите внимание на то, что при выполнении CWLS, Covar0
не должен быть диагональной матрицей даже если CovarFormat
= 'diagonal'
.
Можно сконфигурировать Design
как матрицу если NUMSERIES = 1
или как массив ячеек если NUMSERIES
≥ 1
.
Если Design
является массивом ячеек и NUMSERIES
= 1
, каждая ячейка содержит вектор - строку NUMPARAMS
.
Если Design
является массивом ячеек и NUMSERIES
> 1
, каждая ячейка содержит NUMSERIES
-by-NUMPARAMS
матрица.
Эти замечания касаются, как Design
обрабатывает недостающие данные:
Несмотря на то, что Design
не должен иметь значений NaN
, проигнорированные выборки из-за значений NaN
в Data
также проигнорированы в соответствующем массиве Design
.
Если Design
является 1
-by-1
массив ячеек, который имеет одну матрицу Design
для каждой выборки, никакие значения NaN
не разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES
≥ NUMPARAMS
с rank(Design{1}) = NUMPARAMS
.
ecmlsrmle
более строг, чем mvnrmle
о присутствии значений NaN
в массиве Design
.
Используйте оценки в дополнительной выходной структуре Info
в диагностических целях.
Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.
Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.
Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.
Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.
А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.