ecmninit

Начальное среднее и ковариационное

Описание

пример

[Mean,Covariance] = ecmninit(Data,InitMethod) создает начальные среднее и ковариационные оценки для функции ecmnmle.

пример

[Mean,Covariance] = ecmninit(___,InitMethod) добавляет необязательный аргумент для InitMethod.

Примеры

свернуть все

В этом примере показано, как вычислить начальное среднее и ковариационное значение для пяти лет ежедневных общих данных о возврате для 12 запасов компьютерных технологий с шестью аппаратными и шестью программными компаниями

load ecmtechdemo.mat

Период времени для этих данных простирается с 19 апреля 2000 года до 18 апреля 2005 года. Шестой акции в Assets - Google (GOOG), которая начала торговаться 19 августа 2004 года. Так, все возвраты до 20 августа 2004 года отсутствуют и представлены как NaNs. Также у Amazon (AMZN) было несколько дней с отсутствующими значениями, рассеянными в течение последних пяти лет.

Наивный подход к оценке среднего значения и ковариации для этих 12 активов состоит в том, чтобы исключить все дни, которые имеют отсутствующие значения для любого из 12 активов. Используйте ecminit функция со 'nanskip' опция для этого.

[NaNMean, NaNCovar] = ecmninit(Data,'nanskip')
NaNMean = 12×1

    0.0054
   -0.0006
   -0.0006
    0.0002
   -0.0009
    0.0042
    0.0011
   -0.0005
    0.0002
    0.0001
      ⋮

NaNCovar = 12×12
10-3 ×

    0.7271    0.1003    0.0755    0.0585    0.1363    0.1030    0.0084    0.0741    0.0808    0.0407    0.0889    0.1219
    0.1003    0.5958    0.1293    0.0919    0.2700    0.0554    0.0668    0.0548    0.1223    0.0724    0.1252    0.2317
    0.0755    0.1293    0.2480    0.0841    0.0680    0.0322    0.0721    0.0632    0.1360    0.0562    0.0808    0.1014
    0.0585    0.0919    0.0841    0.1414    0.0656   -0.0010    0.0386    0.0460    0.0617    0.0331    0.0499    0.0528
    0.1363    0.2700    0.0680    0.0656    0.6223    0.2062    0.0797    0.0515    0.0850    0.0436    0.1155    0.2515
    0.1030    0.0554    0.0322   -0.0010    0.2062    0.8376   -0.0103    0.0345    0.0236   -0.0034    0.0069    0.2788
    0.0084    0.0668    0.0721    0.0386    0.0797   -0.0103    0.2462    0.0414    0.0881    0.0268    0.0406    0.0621
    0.0741    0.0548    0.0632    0.0460    0.0515    0.0345    0.0414    0.1011    0.0561    0.0321    0.0494    0.0548
    0.0808    0.1223    0.1360    0.0617    0.0850    0.0236    0.0881    0.0561    0.2642    0.0647    0.1102    0.1094
    0.0407    0.0724    0.0562    0.0331    0.0436   -0.0034    0.0268    0.0321    0.0647    0.0619    0.0583    0.0472
      ⋮

Входные параметры

свернуть все

Данные, заданные как NUMSAMPLES-by- NUMSERIES матрица с NUMSAMPLES выборки NUMSERIES-мерный случайный вектор. Отсутствующие значения обозначаются NaNс.

Типы данных: double

(Необязательно) Методы инициализации для вычисления начальных оценок для среднего значения и ковариации данных, заданных как вектор символов. Методы инициализации:

  • 'nanskip' - Пропустить все записи с NaNс.

  • 'twostage' - Оценка среднего. Заполнение NaNсо средним значением. Затем оцените ковариацию.

  • 'diagonal' - Образуйте диагональную ковариацию.

Типы данных: char

Выходные аргументы

свернуть все

Начальная оценка среднего значения Data, возвращается как NUMSERIES-by- 1 Вектор-столбец.

Первоначальная оценка ковариации Data, возвращается как NUMSERIES-by- NUMSERIES матрица.

Алгоритмы

свернуть все

Модель

Общая модель

ZN(Mean,Covariance),

где каждая строка Data является наблюдением за Z.

Каждое наблюдение Z принято как iid (независимое, идентично распределенное) многомерное нормальное, и отсутствующие значения приняты отсутствующими случайным образом (MAR).

Методы инициализации

Эта стандартная программа имеет три метода инициализации, которые охватывают большинство случаев, каждый со своими преимуществами и недостатками.

nanskip

The nanskip способ хорошо работает с маленькими задачами (менее 10 серий или с монотонными отсутствующими шаблонами данных). Он пропускает любые записи с NaNs и оценивает начальные значения только из полных записей данных. Этот метод инициализации имеет тенденцию привести к самой быстрой сходимости алгоритма ECM. Эта стандартная программа переключается на twostage метод, если он определяет, что значительное количество записей содержит NaN.

twostage

The twostage метод является лучшим выбором для больших задач (более 10 серий). Он оценивает среднее значение для каждой серии, используя все доступные данные для каждой серии. Затем он оценивает ковариационную матрицу с отсутствующими значениями, обработанными как равные среднему, а не как NaNs. Этот метод инициализации является устойчивым, но имеет тенденцию к более медленной сходимости алгоритма ECM.

диагональ

The diagonal метод является методом наихудшего случая, который касается проблемных данных, таких как несвязанные ряды и чрезмерные отсутствующие данные (более 33% отсутствующих данных). Из трех методов инициализации этот метод вызывает самую медленную сходимость алгоритма ECM.

Представлено до R2006a