Регрессия методом наименьших квадратов с отсутствующими данными
[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)
|
|
| Матрица или массив ячеек, который обрабатывает две структуры модели:
|
| (Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию является 100. |
| (Необязательно) Допуск сходимости для алгоритма оценки, основанный на изменениях в оценках параметра модели. Значение по умолчанию |
| |
где | |
| (Необязательно) Допуск сходимости для алгоритма оценки, основанный на изменениях в целевой функции. Значение по умолчанию eps ∧ 3/4, что около 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции для итерации k = 2, 3,.... Сходимость принимается, когда оба |
| (Необязательно) |
| (Необязательно) Для ковариационных взвешенных вычислений методом наименьших квадратов эта матрица соответствует весам для каждой серии в регрессии. Матрица также служит начальным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM). |
| (Необязательно) Вектор символов, который задает формат ковариационной матрицы. Возможны следующие варианты:
|
[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat)
оценивает регрессионую модель методом наименьших квадратов с отсутствующими данными. Модель имеет вид
для выборок k = 1,..., NUMSAMPLES
.
ecmlsrmle
оценивает NUMPARAMS
-by- 1
Вектор-столбец параметров модели называется Parameters
, и NUMSERIES
-by- NUMSERIES
матрица ковариационных параметров, называемая Covariance
.
ecmlsrmle(Data, Design)
без выходных аргументов строит график функции логарифмической правдоподобности для каждой итерации алгоритма.
Результирующие выходы ecmlsrmle
:
Parameters
является NUMPARAMS
-by- 1
Вектор-столбец оценок параметров регрессионной модели.
Covariance
является NUMSERIES
-by- NUMSERIES
матрица оценок для ковариации невязок регрессионной модели. Для моделей с наименьшими квадратами эта оценка может быть не максимальной оценкой правдоподобия, кроме как при особых обстоятельствах.
Resid
является NUMSAMPLES
-by- NUMSERIES
матрица невязок от регрессии.
Другой выход, Info
, является структурой, которая содержит дополнительную информацию от регрессии. Структура имеет следующие поля:
Info.Obj
- вектор-столбец с переменным расширением, не более MaxIterations
элементы, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj
(end)
, - терминальная оценка целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.
Info.PrevParameters
— NUMPARAMS
-by- 1
вектор-столбец оценок для параметров модели из итерации непосредственно перед итерацией терминала.
Info.PrevCovariance
— NUMSERIES
-by- NUMSERIES
матрица оценок для ковариационных параметров из итерации непосредственно перед терминальной итерацией.
При выполнении ковариационного взвешивания методом наименьших квадратов Covar0
обычно должен быть диагональной матрицей. Ряды с большим влиянием должны иметь меньшие диагональные элементы в Covar0
и ряды с меньшим влиянием должны иметь большие диагональные элементы. Обратите внимание, что при выполнении CWLS, Covar0
не обязательно быть матрицей диагонали, даже если CovarFormat
= 'diagonal'
.
Можно конфигурировать Design
как матрица, если NUMSERIES = 1
или как массив ячеек, если NUMSERIES
≥ 1
.
Если Design
является массивом ячеек и NUMSERIES
= 1
каждая камера содержит NUMPARAMS
Вектор-строка.
Если Design
является массивом ячеек и NUMSERIES
> 1
каждая камера содержит NUMSERIES
-by- NUMPARAMS
матрица.
Эти точки касаются того, как Design
обрабатывает отсутствующие данные:
Хотя Design
не должен иметь NaN
значения, проигнорированные выборки из-за NaN
значения в Data
также игнорируются в соответствующих Design
массив.
Если Design
является 1
-by- 1
массив ячеек, который имеет одну Design
матрица для каждой выборки, нет NaN
значения разрешены в массиве. Модель с этой структурой должна иметь NUMSERIES
≥ NUMPARAMS
с rank(Design{1}) = NUMPARAMS
.
ecmlsrmle
является более строгим, чем mvnrmle
о наличии NaN
значения в Design
массив.
Используйте оценки в необязательной структуре output Info
в диагностических целях.
См. Многомерная нормальная регрессия, регрессия методом наименьших квадратов, ковариационная взвешенная методом наименьших квадратов, допустимые обобщенные методом наименьших квадратов и, кажется, несвязанная регрессия.
Родерик Дж. А. Литтл и Дональд Б. Рубин. Статистический анализ с отсутствующими данными. 2-е издание. John Wiley & Sons, Inc., 2002.
Сяо-Ли Мэн и Дональд Б. Рубин. «Максимальная оценка правдоподобия через алгоритм ECM». Биометрика. Том 80, № 2, 1993, стр. 267-278.
Джо Секстон и Андерс Райг Свенсен. «Алгоритмы ECM, которые сходятся со скоростью EM». Биометрика. Том 87, № 3, 2000, стр. 651-662.
А. П. Демпстер, Н.М. Лэрд и Д. Б. Рубин. «Максимальная правдоподобность из неполных данных через алгоритм EM». Журнал Королевского статистического общества. Серия B, том 39, № 1, 1977, стр. 1-37.