ecmlsrmle

Регрессия наименьших квадратов с недостающими данными

Синтаксис

[Parameters,Covariance,Resid,Info] = ecmlsrmle(Data,Design,MaxIterations,TolParam,TolObj,Param0,Covar0,CovarFormat)

Аргументы

Data

NUMSAMPLES-by-NUMSERIES матрица с выборками NUMSAMPLES NUMSERIES - размерный случайный вектор. Отсутствующие значения представлены как NaN s. Только выборки, которые являются полностью NaN s, проигнорированы. (Чтобы проигнорировать выборки по крайней мере с одним NaN, используйте mvnrmle.)

Design

Матрица или массив ячеек, который обрабатывает две образцовых структуры:

  • Если NUMSERIES = 1, Design является NUMSAMPLES-by-NUMPARAMS матрица с известными значениями. Эта структура является стандартной формой для регрессии на одном ряде.

  • Если NUMSERIES1, Design является массивом ячеек. Массив ячеек содержит или один или ячейки NUMSAMPLES. Каждая ячейка содержит NUMSERIES-by-NUMPARAMS матрица известных значений.

    Если Design имеет отдельную ячейку, он принят, чтобы иметь ту же матрицу Design для каждой выборки. Если Design имеет больше чем одну ячейку, каждая ячейка содержит матрицу Design для каждой выборки.

MaxIterations

(Необязательно) Максимальное количество итераций для алгоритма оценки. Значение по умолчанию равняется 100.

TolParam

(Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в оценках параметра модели. Значением по умолчанию является sqrt(eps), который является о 1.0e-8 для двойной точности. Тест сходимости для изменений в параметрах модели

 

ParamkParamk1<TolParam×(1+Paramk)

 

где Param представляет вывод Parameters и итерацию k = 2, 3.... Сходимость принята, когда и TolParam и условия TolObj удовлетворены. Если и TolParam0 и TolObj0, сделайте максимальное количество итераций (MaxIterations), безотносительно результатов тестов сходимости.

TolObj

(Необязательно) Допуск сходимости для алгоритма оценки на основе изменений в целевой функции. Значение по умолчанию является eps ∧ 3/4, который является о 1.0e-12 для двойной точности. Тест сходимости для изменений в целевой функции

|ObjkObjk1|<TolObj×(1+|Objk|)

для итерации k = 2, 3.... Сходимость принята, когда и TolParam и условия TolObj удовлетворены. Если и TolParam0 и TolObj 0, сделайте максимальное количество итераций (MaxIterations), безотносительно результатов тестов сходимости.

Param0

(Необязательно) NUMPARAMS-by-1 вектор-столбец, который содержит предоставленную пользователями первоначальную оценку для параметров модели регрессии. Значением по умолчанию является нулевой вектор.

Covar0

(Необязательно) NUMSERIES-by-NUMSERIES матрица, которая содержит предоставленную пользователями начальную или известную оценку для ковариационной матрицы невязок регрессии. Значением по умолчанию является единичная матрица.

Для вычислений метода взвешенных наименьших квадратов ковариации эта матрица соответствует весам для каждого ряда в регрессии. Матрица также служит исходным предположением для остаточной ковариации в алгоритме условной максимизации ожидания (ECM).

CovarFormat

(Необязательно) Вектор символов, который задает формат для ковариационной матрицы. Выбор:

  • полный Метод по умолчанию. Вычислите полную ковариационную матрицу.

  • 'diagonal' — Обеспечьте ковариационную матрицу, чтобы быть диагональной матрицей.

Описание

[Parameters, Covariance, Resid, Info] = ecmlsrmle(Data, Design, MaxIterations, TolParam, TolObj, Param0, Covar0, CovarFormat) оценивает модель регрессии наименьших квадратов с недостающими данными. Модель имеет форму

DatakN(Designk×Parameters,Covariance)

для выборок k = 1..., NUMSAMPLES.

ecmlsrmle оценивает NUMPARAMS-by-1 вектор-столбец параметров модели под названием Parameters и NUMSERIES-by-NUMSERIES матрица параметров ковариации под названием Covariance.

ecmlsrmle(Data, Design) без выходных аргументов строит логарифмическую функцию правдоподобия для каждой итерации алгоритма.

Обобщать выходные параметры ecmlsrmle:

  • Parameters является NUMPARAMS-by-1 вектор-столбец оценок для параметров модели регрессии.

  • Covariance является NUMSERIES-by-NUMSERIES матрица оценок для ковариации невязок модели регрессии. Для моделей наименьших квадратов эта оценка не может быть оценкой наибольшего правдоподобия кроме при особых обстоятельствах.

  • Resid является NUMSAMPLES-by-NUMSERIES матрица невязок от регрессии.

Другой вывод, Info, является структурой, которая содержит дополнительную информацию от регрессии. Структура имеет эти поля:

  • Info.Obj — Вектор-столбец переменной степени, без больше, чем элементов MaxIterations, которые содержат каждое значение целевой функции при каждой итерации алгоритма оценки. Последнее значение в этом векторе, Obj (end), является терминальной оценкой целевой функции. Если вы делаете наименьшие квадраты, целевая функция является целевой функцией наименьших квадратов.

  • Info.PrevParametersNUMPARAMS-by-1 вектор-столбец оценок для параметров модели от итерации только до терминальной итерации.

  • Info.PrevCovarianceNUMSERIES-by-NUMSERIES матрица оценок для параметров ковариации от итерации только до терминальной итерации.

Примечания

При выполнении метода взвешенных наименьших квадратов ковариации Covar0 должен обычно быть диагональной матрицей. Ряд с большим влиянием должен иметь меньшие диагональные элементы в Covar0, и ряд с меньшим влиянием должен иметь большие диагональные элементы. Обратите внимание на то, что при выполнении CWLS, Covar0 не должен быть диагональной матрицей даже если CovarFormat = 'diagonal'.

Можно сконфигурировать Design как матрицу если NUMSERIES = 1 или как массив ячеек если NUMSERIES1.

  • Если Design является массивом ячеек и NUMSERIES = 1, каждая ячейка содержит вектор - строку NUMPARAMS.

  • Если Design является массивом ячеек и NUMSERIES > 1, каждая ячейка содержит NUMSERIES-by-NUMPARAMS матрица.

Эти замечания касаются, как Design обрабатывает недостающие данные:

  • Несмотря на то, что Design не должен иметь значений NaN, проигнорированные выборки из-за значений NaN в Data также проигнорированы в соответствующем массиве Design.

  • Если Design является 1-by-1 массив ячеек, который имеет одну матрицу Design для каждой выборки, никакие значения NaN не разрешены в массиве. Модель с этой структурой должна иметь NUMSERIESNUMPARAMS с rank(Design{1}) = NUMPARAMS.

  • ecmlsrmle более строг, чем mvnrmle о присутствии значений NaN в массиве Design.

Используйте оценки в дополнительной выходной структуре Info в диагностических целях.

Примеры

Смотрите многомерную нормальную регрессию, регрессию наименьших квадратов, метод взвешенных наименьших квадратов ковариации, выполнимые обобщенные наименьшие квадраты и на вид Несвязанную регрессию.

Ссылки

Родерик Дж. А. Мало и Дональд Б. Рубин. Статистический анализ с Недостающими данными. 2-й выпуск. John Wiley & Sons, Inc., 2002.

Xiao-литий Мэн и Дональд Б. Рубин. “Оценка Наибольшего правдоподобия с помощью Алгоритма ECM”. Biometrika. Издание 80, № 2, 1993, стр 267–278.

Джо Секстон и Андерс Риг Свенсен. “Алгоритмы ECM, которые Сходятся по курсу EM”. Biometrika. Издание 87, № 3, 2000, стр 651–662.

А. П. Демпстер, Нью-Мексико. Лэрд и Д. Б. Рубин. “Наибольшее правдоподобие от Неполных данных с помощью Алгоритма EM”. Журнал Королевского Статистического Общества. Серии B, Издание 39, № 1, 1977, стр 1–37.

Представленный в R2006a

Для просмотра документации необходимо авторизоваться на сайте