Стробируемый рекуррентный модуль
Операция стробируемого рекуррентного модуля (GRU) позволяет сети изучать зависимости между временными шагами во временных рядах и данными последовательности.
Примечание
Эта функция применяет операцию GRU глубокого обучения к dlarray данные. Если необходимо применить операцию GRU в layerGraph объект или Layer массив, используйте следующий слой:
применяет расчет стробируемого рекуррентного модуля (GRU) к входу dlY = gru(dlX,H0,weights,recurrentWeights,bias)dlX использование начального скрытого состояния H0, и параметры weights, recurrentWeights, и bias. Область входа dlX является форматированным dlarray с метками размерностей. Область выхода dlY является форматированным dlarray с теми же метками размерностей, что и dlX, за исключением любых 'S' размерности.
gru функция обновляет скрытое состояние, используя гиперболическую тангенциальную функцию (tanh) в качестве функции активации состояния. gru функция использует сигмоидную функцию, заданную как как функцию активации ворот.
[ также возвращает скрытое состояние после операции GRU.dlY,hiddenState] = gru(dlX,H0,weights,recurrentWeights,bias)
[___] = gru(___,'DataFormat', также задает формат размерности FMT)FMT когда dlX не является форматированным dlarray. Область выхода dlY является неформатированным dlarray с тем же порядком размерностей, что и dlX, за исключением любых 'S' размерности.
functionToLayerGraph не поддерживает gru функция. Если вы используете functionToLayerGraph с функцией, которая содержит gru операция, результат LayerGraph содержит слои заполнителя.
[1] Cho, Kyunghyun, Bart Van Merriénboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, и Yoshua Bengio. «Ознакомление с представлениями фразы с использованием RNN-декодера для статистического машинного перевода». arXiv preprint arXiv:1406.1078 (2014).
dlarray | dlfeval | dlgradient | fullyconnect | lstm | softmax