ecmmvnrmle

Многомерная нормальная регрессия с недостающими данными

Синтаксис

[Parameters,Covariance,Resid,Info] = ecmmvnrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)

Аргументы

Data

NUMSAMPLES- NUMSERIES матрица с NUMSAMPLES выборки NUMSERIES- размерный случайный вектор. Отсутствующие значения представлены как NaNs. Только выборки, которые являются полностью NaNs проигнорированы. (Чтобы проигнорировать выборки по крайней мере с одним NaNИспользование mvnrmle.)

Design

Матрица A или массив ячеек, который обрабатывает две структуры модели:

  • Если NUMSERIES = 1, Design NUMSAMPLES- NUMPARAMS матрица с известными значениями. Эта структура является стандартной формой для регрессии на одном ряде.

  • Если NUMSERIES≥ 1 , Design массив ячеек. Массив ячеек содержит или один или NUMSAMPLES ячейки. Каждая ячейка содержит NUMSERIES- NUMPARAMS матрица известных значений.

    Если Design имеет отдельную ячейку, она принята, чтобы иметь тот же Design матрица для каждой выборки. Если Design имеет больше чем одну ячейку, каждая ячейка содержит Design матрица для каждой выборки.

MaxIterations

(Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100.

TolParam

(Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является sqrt(eps) который является о 1.0e-8 для двойной точности. Тест сходимости для изменений в параметрах модели

ParamkParamk1<TolParam×(1+Paramk)

где Param представляет выход Parameters, и итерация k = 2, 3.... Сходимость принята когда оба TolParam и TolObj условиям удовлетворяют. Если оба TolParam ≤ 0 и TolObj ≤ 0, сделайте максимальное количество итераций (MaxIterations), безотносительно результатов тестов сходимости.

TolObj

(Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значением по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции

|ObjkObjk1|<TolObj×(1+|Objk|)

для итерации k = 2, 3.... Сходимость принята когда оба TolParam и TolObj условиям удовлетворяют. Если оба TolParam ≤ 0 и TolObj ≤ 0 , сделайте максимальное количество итераций (MaxIterations), безотносительно результатов тестов сходимости.

Param0

(Необязательно) NUMPARAMS- 1 вектор-столбец, который содержит предоставленную пользователями первоначальную оценку для параметров модели регрессии.

Covar0

(Необязательно) NUMSERIES- NUMSERIES матрица, которая содержит предоставленную пользователями начальную или известную оценку для ковариационной матрицы остаточных значений регрессии.

CovarFormat

(Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:

  • 'full' — Метод по умолчанию. Вычислите полную ковариационную матрицу.

  • 'diagonal' — Обеспечьте ковариационную матрицу, чтобы быть диагональной матрицей.

Описание

[Parameters,Covariance,Resid,Info] = ecmmvnrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat) оценивает многомерную нормальную модель регрессии с недостающими данными. Модель имеет форму

DatakN(Designk×Parameters,Covariance)

для выборок k = 1..., NUMSAMPLES.

ecmmvnrmle оценивает NUMPARAMS- 1 вектор-столбец параметров модели под названием Parameters, и NUMSERIES- NUMSERIES матрица параметров ковариации под названием Covariance.

ecmmvnrmle(Data, Design) без выходных аргументов строит функцию логарифмической правдоподобности для каждой итерации алгоритма.

Обобщать выходные параметры ecmmvnrmle:

  • Parameters NUMPARAMS- 1 вектор-столбец оценок для параметров модели регрессии.

  • Covariance NUMSERIES- NUMSERIES матрица оценок для ковариации остаточных значений модели регрессии.

  • Resid NUMSAMPLES- NUMSERIES матрица остаточных значений регрессии. Для любых отсутствующих значений в Data, соответствующая невязка является различием между условно оценочным значением для Data и модель, то есть, оценочная невязка.

    Примечание

    Оценка ковариации Covariance не может быть выведен из остаточных значений.

Другой выход, Info, структура, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:

  • Info.Obj — Вектор-столбец переменной степени, без больше, чем MaxIterations элементы, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj(end), терминальная оценка целевой функции. Если вы делаете оценку наибольшего правдоподобия, целевая функция является функцией логарифмической правдоподобности.

  • Info.PrevParametersNUMPARAMS- 1 вектор-столбец оценок для параметров модели от итерации только до терминальной итерации. nfo.PrevCovarianceNUMSERIES- NUMSERIES матрица оценок для параметров ковариации от итерации только до терминальной итерации.

Примечания

ecmmvnrmle не принимает начальный вектор параметра, поскольку параметры оцениваются непосредственно от первой итерации вперед.

Можно сконфигурировать Design как матрица, если NUMSERIES = 1 или как массив ячеек, если NUMSERIES ≥ 1 .

  • Если Design массив ячеек и NUMSERIES= 1 , каждая ячейка содержит NUMPARAMS вектор-строка.

  • Если Design массив ячеек и NUMSERIES> 1  , каждая ячейка содержит NUMSERIES- NUMPARAMS матрица.

Эти замечания касаются как Design обрабатывает недостающие данные:

  • Несмотря на то, что Design не должен иметь NaN значения, проигнорированные выборки из-за NaN значения в Data также проигнорированы в соответствующем Design массив.

  • Если Design 1- 1 массив ячеек, который имеет один Design матрица для каждой выборки, никакого NaN значения разрешены в массиве. Модель с этой структурой должна иметь NUMSERIESNUMPARAMS с rank(Design{1}) = NUMPARAMS.

  • ecmmvnrmle более строго, чем mvnrmle о присутствии NaN значения в Design массив.

Используйте оценки в дополнительной структуре output Info в диагностических целях.

Примеры

Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.

Ссылки

Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.

Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.

Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.

А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.

Введен в R2006a