Долгая краткосрочная память
Операция долгой краткосрочной памяти (LSTM) позволяет сети изучать долгосрочные зависимости между временными шагами во временных рядах и данными последовательности.
Примечание
Эта функция применяет операцию LSTM глубокого обучения к dlarray
данные. Если необходимо применить операцию LSTM в layerGraph
объект или Layer
массив, используйте следующий слой:
применяет расчет долгой краткосрочной памяти (LSTM) к входным dlY
= lstm(dlX
,H0
,C0
,weights
,recurrentWeights
,bias
)dlX
использование начального скрытого состояния H0
, начальное состояние камеры C0
, и параметры weights
, recurrentWeights
, и bias
. Область входа dlX
является форматированным dlarray
с метками размерностей. Область выхода dlY
является форматированным dlarray
с теми же метками размерностей, что и dlX
, за исключением любых 'S'
размерности.
The lstm
функция обновляет камеру и скрытые состояния, используя гиперболическую тангенциальную функцию (tanh) в качестве функции активации состояния. The lstm
функция использует сигмоидную функцию, заданную как как функцию активации ворот.
[
также возвращает скрытое состояние и состояние камеры после операции LSTM.dlY
,hiddenState
,cellState
] = lstm(dlX
,H0
,C0
,weights
,recurrentWeights
,bias
)
[___] = lstm(___,'DataFormat',
также задает формат размерности FMT
)FMT
когда dlX
не является форматированным dlarray
. Область выхода dlY
является неформатированным dlarray
с тем же порядком размерностей, что и dlX
, за исключением любых 'S'
размерности.
functionToLayerGraph
не поддерживает lstm
функция. Если вы используете functionToLayerGraph
с функцией, которая содержит lstm
операция, результат LayerGraph
содержит слои заполнителя.
dlarray
| dlfeval
| dlgradient
| fullyconnect
| gru
| softmax