exponenta event banner

ecmninit

Начальное среднее и ковариация

Описание

пример

[Mean,Covariance] = ecmninit(Data,InitMethod) создает начальные средние и ковариационные оценки для функции ecmnmle.

пример

[Mean,Covariance] = ecmninit(___,InitMethod) добавляет необязательный аргумент для InitMethod.

Примеры

свернуть все

В этом примере показано, как вычислить начальное среднее значение и ковариацию за пять лет ежедневных данных об общей доходности для 12 запасов компьютерных технологий с шестью аппаратными и шестью программными компаниями.

load ecmtechdemo.mat

Период времени для этих данных простирается с 19 апреля 2000 года по 18 апреля 2005 года. Шестой акцией в Assets является Google (GOOG), которая начала торговаться 19 августа 2004 года. Так, все возвращения до 20 августа 2004 года отсутствуют и представлены как NaNS. Также у Amazon (AMZN) было несколько дней с отсутствующими значениями, разбросанными на протяжении последних пяти лет.

Наивный подход к оценке среднего и ковариации для этих 12 активов заключается в исключении всех дней, которые имеют отсутствующие значения для любого из 12 активов. Используйте ecminit функции с помощью 'nanskip' вариант для этого.

[NaNMean, NaNCovar] = ecmninit(Data,'nanskip')
NaNMean = 12×1

    0.0054
   -0.0006
   -0.0006
    0.0002
   -0.0009
    0.0042
    0.0011
   -0.0005
    0.0002
    0.0001
      ⋮

NaNCovar = 12×12
10-3 ×

    0.7271    0.1003    0.0755    0.0585    0.1363    0.1030    0.0084    0.0741    0.0808    0.0407    0.0889    0.1219
    0.1003    0.5958    0.1293    0.0919    0.2700    0.0554    0.0668    0.0548    0.1223    0.0724    0.1252    0.2317
    0.0755    0.1293    0.2480    0.0841    0.0680    0.0322    0.0721    0.0632    0.1360    0.0562    0.0808    0.1014
    0.0585    0.0919    0.0841    0.1414    0.0656   -0.0010    0.0386    0.0460    0.0617    0.0331    0.0499    0.0528
    0.1363    0.2700    0.0680    0.0656    0.6223    0.2062    0.0797    0.0515    0.0850    0.0436    0.1155    0.2515
    0.1030    0.0554    0.0322   -0.0010    0.2062    0.8376   -0.0103    0.0345    0.0236   -0.0034    0.0069    0.2788
    0.0084    0.0668    0.0721    0.0386    0.0797   -0.0103    0.2462    0.0414    0.0881    0.0268    0.0406    0.0621
    0.0741    0.0548    0.0632    0.0460    0.0515    0.0345    0.0414    0.1011    0.0561    0.0321    0.0494    0.0548
    0.0808    0.1223    0.1360    0.0617    0.0850    0.0236    0.0881    0.0561    0.2642    0.0647    0.1102    0.1094
    0.0407    0.0724    0.0562    0.0331    0.0436   -0.0034    0.0268    0.0321    0.0647    0.0619    0.0583    0.0472
      ⋮

Входные аргументы

свернуть все

Данные, указанные как NUMSAMPLESоколо-NUMSERIES матрица с NUMSAMPLES образцы NUMSERIES-мерный случайный вектор. Отсутствующие значения обозначаются NaNs.

Типы данных: double

(Необязательно) Методы инициализации для вычисления начальных оценок для среднего значения и ковариации данных, указанных как символьный вектор. Методы инициализации:

  • 'nanskip' - Пропустить все записи с помощью NaNs.

  • 'twostage' - Оценочное среднее. Заполниться NaNs со средним. Затем оцените ковариацию.

  • 'diagonal' - Образуют диагональную ковариацию.

Типы данных: char

Выходные аргументы

свернуть все

Первоначальная оценка среднего значения Data, возвращено как NUMSERIESоколо-1 вектор столбца.

Начальная оценка ковариации Data, возвращено как NUMSERIESоколо-NUMSERIES матрица.

Алгоритмы

свернуть все

Модель

Общая модель:

Z∼N (Среднее, ковариация),

где каждая строка Data является наблюдением Z.

Предполагается, что каждое наблюдение Z является iid (независимым, идентично распределенным) многомерным нормальным, а отсутствующие значения считаются отсутствующими случайным образом (MAR).

Методы инициализации

Эта процедура имеет три метода инициализации, которые охватывают большинство случаев, каждый из которых имеет свои преимущества и недостатки.

nanskip

nanskip способ хорошо работает с небольшими проблемами (менее 10 серий или с монотонно отсутствующими шаблонами данных). Он пропускает любые записи с NaNs и оценивает начальные значения только по записям полных данных. Этот метод инициализации, как правило, обеспечивает быструю сходимость алгоритма ЕСМ. Эта подпрограмма переключается на twostage метод, если он определяет, что значительное количество записей содержит NaN.

twostage

twostage метод является лучшим выбором для больших задач (более 10 серий). Он оценивает среднее значение для каждой серии, используя все доступные данные для каждой серии. Затем он оценивает ковариационную матрицу с отсутствующими значениями, обрабатываемыми как равные среднему, а не как NaNЭтот способ инициализации является надежным, но приводит к более медленной сходимости алгоритма ECM.

диагональ

diagonal метод - это наихудший подход, который касается проблемных данных, таких как непересекающиеся ряды и избыточные отсутствующие данные (более 33% отсутствующих данных). Из трех методов инициализации этот метод вызывает самую медленную сходимость алгоритма ECM.

Представлен до R2006a