Стробируемый рекуррентный модуль
Операция стробируемого рекуррентного модуля (GRU) позволяет сети изучать зависимости между временными шагами во временных рядах и данными последовательности.
Примечание
Эта функция применяет операцию GRU глубокого обучения к dlarray
данные. Если необходимо применить операцию GRU в layerGraph
объект или Layer
массив, используйте следующий слой:
применяет расчет стробируемого рекуррентного модуля (GRU) к входу dlY
= gru(dlX
,H0
,weights
,recurrentWeights
,bias
)dlX
использование начального скрытого состояния H0
, и параметры weights
, recurrentWeights
, и bias
. Область входа dlX
является форматированным dlarray
с метками размерностей. Область выхода dlY
является форматированным dlarray
с теми же метками размерностей, что и dlX
, за исключением любых 'S'
размерности.
gru
функция обновляет скрытое состояние, используя гиперболическую тангенциальную функцию (tanh) в качестве функции активации состояния. gru
функция использует сигмоидную функцию, заданную как как функцию активации ворот.
[
также возвращает скрытое состояние после операции GRU.dlY
,hiddenState
] = gru(dlX
,H0
,weights
,recurrentWeights
,bias
)
[___] = gru(___,'DataFormat',
также задает формат размерности FMT
)FMT
когда dlX
не является форматированным dlarray
. Область выхода dlY
является неформатированным dlarray
с тем же порядком размерностей, что и dlX
, за исключением любых 'S'
размерности.
functionToLayerGraph
не поддерживает gru
функция. Если вы используете functionToLayerGraph
с функцией, которая содержит gru
операция, результат LayerGraph
содержит слои заполнителя.
[1] Cho, Kyunghyun, Bart Van Merriénboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, и Yoshua Bengio. «Ознакомление с представлениями фразы с использованием RNN-декодера для статистического машинного перевода». arXiv preprint arXiv:1406.1078 (2014).
dlarray
| dlfeval
| dlgradient
| fullyconnect
| lstm
| softmax