Регрессия наименьших квадратов с недостающими данными
[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица или массив ячеек, который обрабатывает две образцовых структуры:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является |
|
| |
где | |
| (Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значение по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3.... Сходимость принята, когда и |
| (Необязательно) |
| (Необязательно) Для вычислений метода взвешенных наименьших квадратов ковариации эта матрица соответствует весам для каждого ряда в регрессии. Матрица также служит исходным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM). |
| (Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:
|
[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat) оценивает модель регрессии наименьших квадратов с недостающими данными. Модель имеет форму
для выборок k = 1..., NUMSAMPLES.
ecmlsrmle оценивает NUMPARAMS-by-1 вектор-столбец параметров модели под названием Parameters и NUMSERIES-by-NUMSERIES матрица параметров ковариации под названием Covariance.
ecmlsrmle(Data, Design) без выходных аргументов строит логарифмическую функцию правдоподобия для каждой итерации алгоритма.
Обобщать выходные параметры ecmlsrmle:
Parameters является NUMPARAMS-by-1 вектор-столбец оценок для параметров модели регрессии.
Covariance является NUMSERIES-by-NUMSERIES матрица оценок для ковариации невязок модели регрессии. Для моделей наименьших квадратов эта оценка не может быть оценкой наибольшего правдоподобия кроме при особых обстоятельствах.
Resid является NUMSAMPLES-by-NUMSERIES матрица невязок от регрессии.
Другой вывод, Info, является структурой, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:
Info.Obj — Вектор-столбец переменной степени, без больше, чем элементов MaxIterations, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj (end), является терминальной оценкой целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.
Info.PrevParameters — NUMPARAMS-by-1 вектор-столбец оценок для параметров модели от итерации только до терминальной итерации.
Info.PrevCovariance — NUMSERIES-by-NUMSERIES матрица оценок для параметров ковариации от итерации только до терминальной итерации.
При выполнении метода взвешенных наименьших квадратов ковариации Covar0 должен обычно быть диагональной матрицей. Ряд с большим влиянием должен иметь меньшие диагональные элементы в Covar0, и ряд с меньшим влиянием должен иметь большие диагональные элементы. Обратите внимание на то, что при выполнении CWLS, Covar0 не должен быть диагональной матрицей даже если CovarFormat = 'diagonal'.
Можно сконфигурировать Design как матрицу если NUMSERIES = 1 или как массив ячеек если NUMSERIES ≥ 1.
Если Design является массивом ячеек и NUMSERIES = 1, каждая ячейка содержит вектор - строку NUMPARAMS.
Если Design является массивом ячеек и NUMSERIES > 1, каждая ячейка содержит NUMSERIES-by-NUMPARAMS матрица.
Эти замечания касаются, как Design обрабатывает недостающие данные:
Несмотря на то, что Design не должен иметь значений NaN, проигнорированные выборки из-за значений NaN в Data также проигнорированы в соответствующем массиве Design.
Если Design является 1-by-1 массив ячеек, который имеет одну матрицу Design для каждой выборки, никакие значения NaN не разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES ≥ NUMPARAMS с rank(Design{1}) = NUMPARAMS.
ecmlsrmle более строг, чем mvnrmle о присутствии значений NaN в массиве Design.
Используйте оценки в дополнительной выходной структуре Info в диагностических целях.
Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.
Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.
Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.
Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.
А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.