gru

Стробируемый рекуррентный модуль

Синтаксис

dlY = gru(dlX,H0,weights,recurrentWeights,bias)

[dlY,hiddenState] = gru(dlX,H0,weights,recurrentWeights,bias)

[___] = gru(___,'DataFormat',FMT)

Описание

Операция стробируемого рекуррентного модуля (GRU) позволяет сети изучать зависимости между временными шагами во временных рядах и данными последовательности.

Примечание

Эта функция применяет операцию GRU глубокого обучения к dlarray данные. Если необходимо применить операцию GRU в layerGraph объект или Layer массив, используйте следующий слой:

gruLayer

пример

dlY = gru(dlX,H0,weights,recurrentWeights,bias) применяет расчет стробируемого рекуррентного модуля (GRU) к входу dlX использование начального скрытого состояния H0, и параметры weights, recurrentWeights, и bias. Область входа dlX является форматированным dlarray с метками размерностей. Область выхода dlY является форматированным dlarray с теми же метками размерностей, что и dlX, за исключением любых 'S' размерности.

gru функция обновляет скрытое состояние, используя гиперболическую тангенциальную функцию (tanh) в качестве функции активации состояния. gru функция использует сигмоидную функцию, заданную как $σ (x) = {(1 + e^{- x})}^{- 1}$ как функцию активации ворот.

[dlY,hiddenState] = gru(dlX,H0,weights,recurrentWeights,bias) также возвращает скрытое состояние после операции GRU.

[___] = gru(___,'DataFormat',FMT) также задает формат размерности FMT когда dlX не является форматированным dlarray. Область выхода dlY является неформатированным dlarray с тем же порядком размерностей, что и dlX, за исключением любых 'S' размерности.

Примеры

свернуть все

Применение операции GRU к данным последовательности

Открыть Live Script

Выполните операцию GRU с использованием 100 скрытых модулей.

Создайте данные последовательности входа как 32 наблюдения с десятью каналами и длиной последовательности 64.

numFeatures = 10;
numObservations = 32;
sequenceLength = 64;

X = randn(numFeatures,numObservations,sequenceLength);
dlX = dlarray(X,'CBT');

Создайте начальное скрытое состояние со 100 скрытыми модулями. Используйте то же начальное скрытое состояние для всех наблюдений.

numHiddenUnits = 100;
H0 = zeros(numHiddenUnits,1);

Создайте настраиваемые параметры для операции GRU.

weights = dlarray(randn(3*numHiddenUnits,numFeatures));
recurrentWeights = dlarray(randn(3*numHiddenUnits,numHiddenUnits));
bias = dlarray(randn(3*numHiddenUnits,1));

Выполните расчет ГРУ.

[dlY,hiddenState] = gru(dlX,H0,weights,recurrentWeights,bias);

Просмотр меток размеров и размерностей dlY.

size(dlY)

ans = 1×3

   100    32    64

dlY.dims

ans = 
'CBT'

Просмотрите размер hiddenState.

size(hiddenState)

ans = 1×2

   100    32

Можно использовать скрытое состояние, чтобы отслеживать состояние операции GRU и вводить дополнительные последовательные данные.

Входные параметры

свернуть все

`dlX` - Входные данные
`dlarray` | числовой массив

Входные данные, заданные как dlarray с метками размерностей или без них или числовым массивом. Когда dlX не является форматированным dlarrayнеобходимо задать формат метки размерности с помощью 'DataFormat',FMT. Если dlX является числовым массивом, по крайней мере, один из H0, weights, recurrentWeights, или bias должен быть dlarray.

dlX должен содержать размерность последовательности, помеченный 'T'. Если dlX имеет любые пространственные размерности, помеченные 'S', они сплющены в 'C' размерность канала. Если dlX не имеет размерности канала, затем добавляется один. Если dlX имеет какие-либо неопределенные размерности, помеченные 'U'Они должны быть одиночками.