Скрытые модели Маркова (HMM)

Введение в Скрытые модели Маркова (HMM)

hidden Markov model (HMM) является тем, в котором вы наблюдаете последовательность эмиссии, но не знаете последовательность состояний, до которых пошла модель, генерируют эмиссию. Исследования скрытых моделей Маркова стремятся восстановить последовательность состояний от наблюдаемых данных.

Как пример, рассмотрите модель Маркова с двумя состояниями и шестью возможной эмиссией. Образцовое использование:

Красный умирает, имея шесть сторон, маркировал 1 through 6.
Зеленый умирает, имея двенадцать сторон, пять из которых маркированы 2 through 6, в то время как остающиеся семь сторон маркированы 1.
Взвешенная красная монета, для которой вероятность голов.9 и вероятность хвостов.1.
Взвешенная зеленая монета, для которой вероятность голов.95 и вероятность хвостов.05.

Модель создает последовательность чисел из набора {1, 2, 3, 4, 5, 6} со следующими правилами:

Начните путем прокрутки красного, умирают и запись номера, который подходит, который является эмиссией.
Встряхните красную монету и выполните одно из следующих действий:
- Если результатом являются головы, прокрутитесь, красный умирают и записывают результат.
- Если результатом являются хвосты, прокрутитесь, зеленый умирают и записывают результат.
На каждом последующем шаге вы инвертируете монету, которая имеет тот же цвет как умирание, вы насыпали предыдущий шаг. Если монета подходит головы, прокрутитесь, то же самое умирают как на предыдущем шаге. Если монета подходит хвосты, переключатель к другому умирала.

Диаграмма состояний для этой модели имеет два состояния, красные и зеленые, как показано в следующей фигуре.

Вы определяете эмиссию состояния путем прокрутки умирания с тем же цветом как состояние. Вы определяете переход к следующему состоянию путем зеркального отражения монеты с тем же цветом как состояние.

Матрица перехода:

$T = [\begin{matrix} \begin{array}{l} \end{array} & \begin{array}{l} 0.90.050.10.95 \end{array} \end{matrix}]$

Матрица эмиссии:

$E = [\begin{matrix} \frac{}{16} & \frac{}{16} & \frac{}{16} & \frac{}{16} & \frac{}{16} & \frac{}{16} \\ \frac{7}{12} & \frac{1}{12} & \frac{1}{12} & \frac{1}{12} & \frac{1}{12} & \frac{1}{12} \end{matrix}]$

Модель не скрыта, потому что вы знаете последовательность состояний от цветов монет и игры в кости. Предположим, однако, что кто-то еще генерирует эмиссию, не показывая вам игру в кости или монеты. Все, что вы видите, является последовательностью эмиссии. Если вы начинаете видеть больше 1 с, чем другие числа, вы можете подозревать, что модель находится в зеленом состоянии, но вы не можете быть уверены, потому что вы не видите, что цвет умирания прокручивается.

Скрытые модели Маркова поднимают следующие вопросы:

Учитывая последовательность эмиссии, каков наиболее вероятный путь состояния?
Учитывая последовательность эмиссии, как можно оценить вероятности перехода и эмиссии модели?
Какова прямая вероятность, что модель генерирует данную последовательность?
Какова апостериорная вероятность, что модель находится в конкретном состоянии в какой-либо точке в последовательности?

Анализ скрытых моделей Маркова

Генерация тестовой последовательности
Оценка последовательности состояния
Оценка матриц перехода и эмиссии
Оценка следующих вероятностей состояния
Изменение распределения начального состояния

Функции Statistics and Machine Learning Toolbox™, связанные со скрытыми моделями Маркова:

hmmgenerate — Генерирует последовательность состояний и выбросов модели Маркова
hmmestimate — Вычисляет оценки наибольшего правдоподобия вероятностей перехода и эмиссии от последовательности эмиссии и известной последовательности состояний
hmmtrain — Вычисляет оценки наибольшего правдоподобия вероятностей перехода и эмиссии от последовательности эмиссии
hmmviterbi — Вычисляет самый вероятный путь состояния для скрытой модели Маркова
hmmdecode — Вычисляет следующие вероятности состояния последовательности эмиссии

Этот раздел показывает, как использовать эти функции, чтобы анализировать скрытые модели Маркова.

Генерация тестовой последовательности

Следующие команды создают матрицы перехода и эмиссии для модели, описанной во Введении в Скрытые модели Маркова (HMM):

TRANS = [.9 .1; .05 .95];

EMIS = [1/6, 1/6, 1/6, 1/6, 1/6, 1/6;...
7/12, 1/12, 1/12, 1/12, 1/12, 1/12];

Чтобы сгенерировать случайную последовательность состояний и выбросов модели, используйте hmmgenerate:

[seq,states] = hmmgenerate(1000,TRANS,EMIS);

Вывод seq является последовательностью эмиссии, и вывод states является последовательностью состояний.

hmmgenerate начинается в состоянии 1 на шаге 0, делает переход, чтобы утвердить i ₁ на шаге 1 и возвращает i ₁ как первая запись в states. Чтобы изменить начальное состояние, смотрите Изменение Распределения начального состояния.

Оценка последовательности состояния

Учитывая матрицы перехода и эмиссии TRANS и EMIS, функциональный hmmviterbi использует алгоритм Viterbi, чтобы вычислить наиболее вероятную последовательность состояний, до которых пошла бы модель, генерируют данную последовательность seq эмиссии:

likelystates = hmmviterbi(seq, TRANS, EMIS);

likelystates является последовательностью та же длина как seq.

Чтобы протестировать точность hmmviterbi, вычислите процент фактической последовательности states, который согласовывает с последовательностью likelystates.

sum(states==likelystates)/1000
ans =
   0.8200

В этом случае наиболее вероятная последовательность состояний согласовывает со случайной последовательностью 82% времени.

Функции hmmestimate и hmmtrain оценивают матрицы перехода и эмиссии TRANS и EMIS, учитывая последовательность seq эмиссии.

Используя hmmestimate. Функциональный hmmestimate требует, чтобы вы знали последовательность состояний states, до которого пошла модель, генерируют seq.

Следующий берет эмиссию и последовательности состояния и возвращает оценки матриц перехода и эмиссии:

[TRANS_EST, EMIS_EST] = hmmestimate(seq, states)

TRANS_EST =
0.8989    0.1011
0.0585    0.9415

EMIS_EST =
0.1721    0.1721    0.1749    0.1612    0.1803    0.1393
0.5836    0.0741    0.0804    0.0789    0.0726    0.1104

Можно сравнить выходные параметры с исходными матрицами перехода и эмиссии, TRANS и EMIS:

TRANS
TRANS =
0.9000    0.1000
0.0500    0.9500

EMIS
EMIS =
0.1667    0.1667    0.1667    0.1667    0.1667    0.1667
0.5833    0.0833    0.0833    0.0833    0.0833    0.0833

Используя hmmtrain. Если вы не знаете последовательность состояний states, но у вас есть исходные предположения для TRANS и EMIS, можно все еще оценить TRANS и EMIS с помощью hmmtrain.

Предположим, что у вас есть следующие исходные предположения для TRANS и EMIS.

TRANS_GUESS = [.85 .15; .1 .9];
EMIS_GUESS = [.17 .16 .17 .16 .17 .17;.6 .08 .08 .08 .08 08];

Вы оцениваете TRANS и EMIS можно следующим образом:

[TRANS_EST2, EMIS_EST2] = hmmtrain(seq, TRANS_GUESS, EMIS_GUESS)

TRANS_EST2 =
0.2286    0.7714
0.0032    0.9968

EMIS_EST2 =
0.1436    0.2348    0.1837    0.1963    0.2350    0.0066
0.4355    0.1089    0.1144    0.1082    0.1109    0.1220

hmmtrain использует итеративный алгоритм, который изменяет матрицы TRANS_GUESS и EMIS_GUESS так, чтобы на каждом шаге настроенные матрицы, более вероятно, сгенерировали наблюдаемую последовательность, seq. Алгоритм останавливается, когда матрицы в двух последовательных итерациях в маленьком допуске друг друга.

Если алгоритму не удается достигнуть этого допуска в максимальном количестве итераций, значением по умолчанию которых является 100, остановы алгоритма. В этом случае hmmtrain возвращает последние значения TRANS_EST и EMIS_EST и выдает предупреждение, что допуск не был достигнут.

Если алгоритму не удается достигнуть желаемого допуска, увеличить значение по умолчанию максимального количества итераций с командой:

hmmtrain(seq,TRANS_GUESS,EMIS_GUESS,'maxiterations',maxiter)

где maxiter является максимальным количеством шагов, алгоритм выполняется.

Измените значение по умолчанию допуска с командой:

hmmtrain(seq, TRANS_GUESS, EMIS_GUESS, 'tolerance', tol)

где tol является требуемым значением допуска. Увеличение значения tol заставляет алгоритм остановиться раньше, но результаты менее точны.

Два фактора уменьшают надежность выходных матриц hmmtrain:

Алгоритм сходится к локальному максимуму, который не представляет истинные матрицы перехода и эмиссии. Если вы подозреваете это, используйте различные исходные предположения для матриц TRANS_EST и EMIS_EST.
Последовательность seq может быть слишком короткой, чтобы правильно обучить матрицы. Если вы подозреваете это, используйте более длинную последовательность для seq.

Оценка следующих вероятностей состояния

Следующие вероятности состояния последовательности эмиссии, seq является условными вероятностями, что модель находится в конкретном состоянии, когда это генерирует символ в seq, учитывая, что seq испускается. Вы вычисляете следующие вероятности состояния с hmmdecode:

PSTATES = hmmdecode(seq,TRANS,EMIS)

Выводом PSTATES является M-by-L матрица, где M является количеством состояний, и L является длиной seq. PSTATES(i,j) является условной вероятностью, что модель находится в i состояния, когда это генерирует j th символ seq, учитывая, что seq испускается.

hmmdecode начинается с модели в состоянии 1 на шаге 0 до первой эмиссии. PSTATES(i,1) является вероятностью, что модель находится в состоянии i в следующем шаге 1. Чтобы изменить начальное состояние, смотрите Изменение Распределения начального состояния.

Чтобы возвратить логарифм вероятности последовательности seq, используйте второй выходной аргумент hmmdecode:

[PSTATES,logpseq] = hmmdecode(seq,TRANS,EMIS)

Вероятность последовательности склоняется к 0, когда длина последовательности увеличивается, и вероятность достаточно длинной последовательности становится меньше, чем самое маленькое положительное число, которое может представлять ваш компьютер. hmmdecode возвращает логарифм вероятности, чтобы избежать этой проблемы.

Изменение распределения начального состояния

По умолчанию Statistics and Machine Learning Toolbox скрытые функции модели Маркова начинается в состоянии 1. Другими словами, распределение начальных состояний имеет всю свою вероятностную меру, сконцентрированную в состоянии 1. Чтобы присвоить различное распределение вероятностей, p = [p ₁, p ₂..., p _M], к начальным состояниям M, делает следующее:

Создайте M, +1-by-M+1 увеличил матрицу перехода, $\hat{T}$ из следующей формы:
$\hat{T} = [\begin{matrix} 0 & p \\ 0 & T \end{matrix}]$
где T является истинной матрицей перехода. Первый столбец $\hat{T}$ содержит M +1 нуль. p должен суммировать к 1.
Создайте M, +1-by-N увеличил матрицу эмиссии, $\hat{E}$ , это имеет следующую форму:
$\hat{E} = [\begin{matrix} 0 \\ E \end{matrix}]$

Если матрицами перехода и эмиссии является TRANS и EMIS, соответственно, вы создаете увеличенные матрицы со следующими командами:

TRANS_HAT = [0 p; zeros(size(TRANS,1),1) TRANS];

EMIS_HAT = [zeros(1,size(EMIS,2)); EMIS];

Документация