Стробированная рекуррентная установка
Работа стробируемого повторяющегося блока (ГРУ) позволяет сети узнать зависимости между временными шагами во временных рядах и данными последовательности.
Примечание
Эта функция применяет операцию глубокого обучения GRU к dlarray данные. Если вы хотите применить операцию GRU в layerGraph объект или Layer используйте следующий слой:
применяет расчет стробируемой повторяющейся единицы (ГРУ) к входу dlY = gru(dlX,H0,weights,recurrentWeights,bias)dlX с использованием начального скрытого состояния H0, и параметры weights, recurrentWeights, и bias. Вход dlX является отформатированным dlarray с метками размеров. Продукция dlY является отформатированным dlarray с теми же метками размеров, что и dlX, за исключением любого 'S' размеры.
gru функция обновляет скрытое состояние, используя гиперболическую касательную функцию (tanh) в качестве функции активации состояния. gru функция использует в качестве функции активации затвора сигмоидную функцию, заданную (x) = (1 + e − x) − 1.
[ также возвращает скрытое состояние после операции GRU.dlY,hiddenState] = gru(dlX,H0,weights,recurrentWeights,bias)
[___] = gru(___,'DataFormat', также задает формат размера FMT)FMT когда dlX не является отформатированным dlarray. Продукция dlY является неформатированным dlarray с тем же порядком размеров, что и dlX, за исключением любого 'S' размеры.
functionToLayerGraph не поддерживает gru функция. Если вы используете functionToLayerGraph с функцией, содержащей gru операция, результат LayerGraph содержит слои-заполнители.
[1] Чо, Кюнгхюн, Барт Ван Мерриэнбоер, Каглар Гульчехре, Дзмитри Бахданау, Фетхи Бугарес, Хольгер Швенк и Йошуа Бенгио. «Изучение представления фразы с использованием кодера-декодера RNN для статистического машинного перевода» arXiv preprint arXiv:1406.1078 (2014).
dlarray | dlfeval | dlgradient | fullyconnect | lstm | softmax