gruLayer

Стробированные периодические модули (GRU) слоя

развернуть все на странице

Описание

GRU слоя изучает зависимости между временными шагами во временных рядах и данными последовательности.

Создание

Синтаксис

layer = gruLayer(numHiddenUnits)

layer = gruLayer(numHiddenUnits,Name,Value)

Описание

пример

layer = gruLayer(numHiddenUnits) создает слой GRU и устанавливает NumHiddenUnits свойство.

layer = gruLayer(numHiddenUnits,Name,Value) устанавливает дополнительные OutputMode, Активации, Состояние, Параметры и Инициализация, Скорость Обучения и Регуляризация, и Name свойства с использованием одного или нескольких аргументов пары "имя-значение". Можно задать несколько аргументы пары "имя-значение". Заключайте каждое имя свойства в кавычки.

Свойства

расширить все

ГРУ

`NumHiddenUnits` - Количество скрытых модулей
положительное целое число

Количество скрытых модулей измерения (также известное как скрытый размер), заданное как положительное целое число.

Количество скрытых модулей соответствует объему информации, запоминаемой между временными шагами (скрытое состояние). Скрытое состояние может содержать информацию от всех предыдущих временных шагов, независимо от длины последовательности. Если количество скрытых модулей слишком велико, слой может перегружаться обучающими данными. Это значение может варьироваться от нескольких десятков до нескольких тысяч.

Скрытое состояние не ограничивает количество временных шагов, которые обрабатываются в итерации. Чтобы разделить ваши последовательности на меньшие последовательности для обучения, используйте 'SequenceLength' опция в trainingOptions.

Пример: 200

`OutputMode` - Формат выхода
`'sequence'` (по умолчанию) | `'last'`

Формат вывода, заданный как один из следующих:

'sequence' - Вывод полной последовательности.
'last' - Вывод последнего временного шага последовательности.

`ResetGateMode` - Сброс режима управления ключами
`'after-multiplication'` (по умолчанию) | `'before-multiplication'` | `'recurrent-bias-after-multiplication'`

Сбросьте режим управления ключами, заданный как один из следующих:

'after-multiplication' - Применить ворота сброса после матричного умножения. Эта опция совместима с cuDNN.
'before-multiplication' - Применить логику сброса перед умножением матрицы.
'recurrent-bias-after-multiplication' - Применить ворота сброса после умножения матрицы и использовать дополнительный набор терминов смещения для повторяющихся весов.

Для получения дополнительной информации о расчетах сброса ключа см. Раздел «Затворный слой периодических модулей».

`InputSize` - Вход сигнала
`'auto'` (по умолчанию) | положительное целое число

Размер входа, заданный как положительное целое или 'auto'. Если InputSize является 'auto', затем программа автоматически присваивает размер входа во время обучения.

Пример: 100

Активации

`StateActivationFunction` - Функция активации для обновления скрытого состояния
`'tanh'` (по умолчанию) | `'softsign'`

Функция активации для обновления скрытого состояния, заданная как одно из следующего:

'tanh' - Используйте гиперболическую функцию тангенса (tanh).
'softsign' - Используйте функцию softsign $softsign (x) = \frac{x}{1 + | x |}$ .

Слой использует эту опцию как функцию $σ_{s}$ в вычислениях для обновления скрытого состояния.

`GateActivationFunction` - Функция активации для применения к воротам
`'sigmoid'` (по умолчанию) | `'hard-sigmoid'`

Функция активации для применения к воротам, заданная как одно из следующего:

'sigmoid' - Используйте сигмоидную функцию $σ (x) = {(1 + e^{- x})}^{- 1}$ .
'hard-sigmoid' - Используйте жесткую сигмоидную функцию

$σ (x) = {\begin{matrix} \begin{array}{l} 0 \\ 0.2 x + 0.5 \\ 1 \end{array} & \begin{array}{l} если x < - 2.5 \\ если - 2.5 \leq x \leq 2.5 \\ если x > 2.5 \end{array} \end{matrix} .$

Слой использует эту опцию как функцию $σ_{g}$ в расчетах для затворов слоя.

Государство

`HiddenState` - Начальное значение скрытого состояния
числовой вектор

Начальное значение скрытого состояния, заданное как NumHiddenUnits-by-1 числовой вектор. Это значение соответствует скрытому состоянию во временной шаг 0.

После установки этого свойства вызовы на resetState функция устанавливает скрытое состояние на это значение.

Параметры и инициализация

`InputWeightsInitializer` - Функция для инициализации входных весов
`'glorot'` (по умолчанию) | `'he'` | `'orthogonal'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

Функция для инициализации весов входа, заданная как одно из следующего:

'glorot' - Инициализируйте входные веса с помощью инициализатора Glorot [2] (также известного как инициализатор Xavier). Инициализатор Glorot независимо выбирает из равномерного распределения с нулем среднего и отклонением 2/(InputSize + numOut), где numOut = 3*NumHiddenUnits.
'he' - Инициализируйте входные веса с помощью инициализатора He [3]. Инициализатор He производит выборки из нормального распределения с нулем среднего и отклонением 2/InputSize.
'orthogonal' - Инициализируйте веса входа с помощью Q, ортогональной матрицы, заданной QR-разложением Z = Q R для случайной матрицы, Z выбранной из модуля нормального распределения. [4]
'narrow-normal' - Инициализируйте входные веса путем независимой выборки из нормального распределения с нулевым средним и стандартным отклонением 0,01.
'zeros' - Инициализируйте входные веса с нулями.
'ones' - Инициализируйте входные веса с таковые.
Указатель на функцию - Инициализируйте входные веса с помощью пользовательской функции. Если вы задаете указатель на функцию, то функция должна иметь вид weights = func(sz), где sz - размер входных весов.

Слой инициализирует входные веса только тогда, когда InputWeights свойство пустое.

Типы данных: char | string | function_handle

`RecurrentWeightsInitializer` - Функция для инициализации повторяющихся весов
`'orthogonal'` (по умолчанию) | `'glorot'` | `'he'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

Функция для инициализации повторяющихся весов, заданная как одно из следующего:

'orthogonal' - Инициализируйте рекуррентные веса с Q, ортогональной матрицей, заданной QR-разложением Z = Q R для случайной матричной Z, выбранной из модуля нормального распределения. [4]
'glorot' - Инициализируйте повторяющиеся веса с помощью инициализатора Glorot [2] (также известного как инициализатор Xavier). Инициализатор Glorot независимо выбирает из равномерного распределения с нулем среднего и отклонением 2/(numIn + numOut), где numIn = NumHiddenUnits и numOut = 3*NumHiddenUnits.
'he' - Инициализируйте повторяющиеся веса с помощью инициализатора He [3]. Инициализатор He производит выборки из нормального распределения с нулем среднего и отклонением 2/NumHiddenUnits.
'narrow-normal' - Инициализируйте рекуррентные веса путем независимой выборки из нормального распределения с нулевым средним и стандартным отклонением 0,01.
'zeros' - Инициализируйте повторяющиеся веса с нулями.
'ones' - Инициализируйте повторяющиеся веса с таковыми.
Указатель на функцию - Инициализируйте повторяющиеся веса с помощью пользовательской функции. Если вы задаете указатель на функцию, то функция должна иметь вид weights = func(sz), где sz - размер повторяющихся весов.

Слой инициализирует повторяющиеся веса только тогда, когда RecurrentWeights свойство пустое.

Типы данных: char | string | function_handle

`BiasInitializer` - Функция для инициализации смещения
`'zeros'` (по умолчанию) | `'narrow-normal'` | `'ones'` | указатель на функцию

Функция для инициализации смещения, заданная как одно из следующего:

zeros' - Инициализируйте смещение с нулями.
'narrow-normal' - Инициализируйте смещение путем независимой выборки из нормального распределения с нулевым средним и стандартным отклонением 0,01.
'ones' - Инициализируйте смещение с таковые.
Указатель на функцию - Инициализируйте смещение с помощью пользовательской функции. Если вы задаете указатель на функцию, то функция должна иметь вид bias = func(sz), где sz - размер смещения.

Слой инициализирует смещение только тогда, когда Bias свойство пустое.

Типы данных: char | string | function_handle

`InputWeights` - Входные веса
`[]` (по умолчанию) | матрица

Входные веса, заданные как матрица.

Вход веса является конкатенацией трех матриц входного веса для компонентов в слое GRU. Три матрицы объединены вертикально в следующем порядке:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Входные веса являются настраиваемыми параметрами. При обучении сети, если InputWeights непусто, тогда trainNetwork использует InputWeights свойство как начальное значение. Если InputWeights пуст, тогда trainNetwork использует инициализатор, заданный как InputWeightsInitializer.

Во время обучения InputWeights является 3*NumHiddenUnits-by- InputSize матрица.

`RecurrentWeights` - Периодические веса
`[]` (по умолчанию) | матрица

Периодические веса, заданные как матрица.

Матрица рекуррентного веса является конкатенацией трех матриц рекуррентного веса для компонентов в слое GRU. Три матрицы сгруппированы по вертикали в следующем порядке:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Рекуррентные веса являются настраиваемыми параметрами. При обучении сети, если RecurrentWeights непусто, тогда trainNetwork использует RecurrentWeights свойство как начальное значение. Если RecurrentWeights пуст, тогда trainNetwork использует инициализатор, заданный как RecurrentWeightsInitializer.

Во время обучения RecurrentWeights является 3*NumHiddenUnits-by- NumHiddenUnits матрица.

`Bias` - Смещения слоев
`[]` (по умолчанию) | числовой вектор

Смещения слоев для слоя GRU, заданные как числовой вектор.

Если ResetGateMode является 'after-multiplication' или 'before-multiplication', тогда вектор смещения является конкатенацией трех векторов смещения для компонентов в слое GRU. Три вектора объединены вертикально в следующем порядке:

Сбросьте ворота
Обновление ворот
Состояние кандидата

В этом случае во время обучения Bias является 3*NumHiddenUnits-by-1 числовой вектор.

Если ResetGateMode является recurrent-bias-after-multiplication', тогда вектор смещения является конкатенацией шести векторов смещения для компонентов в слое GRU. Шесть векторов объединены вертикально в следующем порядке:

Сбросьте ворота
Обновление ворот
Состояние кандидата
Сброс затвора (повторяющееся смещение)
Обновление ключа (повторяющееся смещение)
Состояние кандидата (повторяющееся смещение)

В этом случае во время обучения Bias является 6*NumHiddenUnits-by-1 числовой вектор.

Смещения слоя являются настраиваемыми параметрами. При обучении сети, если Bias непусто, тогда trainNetwork использует Bias свойство как начальное значение. Если Bias пуст, тогда trainNetwork использует инициализатор, заданный как BiasInitializer.

Темп обучения и регуляризация

`InputWeightsLearnRateFactor` - Коэффициент скорости обучения для входных весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

Коэффициент скорости обучения для входных весов, заданный как числовой скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальную скорость обучения, чтобы определить коэффициент скорости обучения для входных весов слоя. Для примера, если InputWeightsLearnRateFactor равен 2, тогда коэффициент скорости обучения для входных весов слоя вдвое превышает текущую глобальную скорость обучения. Программа определяет глобальную скорость обучения на основе настроек, заданных в trainingOptions функция.

Чтобы управлять значением коэффициента скорости обучения для трех отдельных матриц в InputWeights, задайте вектор 1 на 3. Записи InputWeightsLearnRateFactor соответствуют коэффициенту скорости обучения:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Чтобы задать одно и то же значение для всех матриц, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

`RecurrentWeightsLearnRateFactor` - Коэффициент скорости обучения для периодических весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

Коэффициент скорости обучения для рекуррентных весов, заданный как числовой скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальный темп обучения, чтобы определить скорость обучения для повторяющихся весов слоя. Для примера, если RecurrentWeightsLearnRateFactor равен 2, тогда скорость обучения для повторяющихся весов слоя в два раза превышает текущую глобальную скорость обучения. Программа определяет глобальную скорость обучения на основе настроек, заданных в trainingOptions функция.

Чтобы управлять значением коэффициента скорости обучения для трех отдельных матриц в RecurrentWeights, задайте вектор 1 на 3. Записи RecurrentWeightsLearnRateFactor соответствуют коэффициенту скорости обучения:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Чтобы задать одно и то же значение для всех матриц, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

`BiasLearnRateFactor` - Коэффициент скорости обучения для смещений
1 (по умолчанию) | неотрицательный скаляр | числовым вектором 1 на 3

Коэффициент скорости обучения для смещений, заданный как неотрицательный скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальную скорость обучения, чтобы определить скорость обучения для смещений на этом слое. Для примера, если BiasLearnRateFactor равен 2, тогда скорость обучения для смещений в слое в два раза превышает текущую глобальную скорость обучения. Программа определяет глобальную скорость обучения на основе настроек, заданных в trainingOptions функция.

Чтобы управлять значением коэффициента скорости обучения для трех отдельных векторов в Bias, задайте вектор 1 на 3. Записи BiasLearnRateFactor соответствуют коэффициенту скорости обучения:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Если ResetGateMode является 'recurrent-bias-after-multiplication', затем программное обеспечение использует тот же вектор для рекуррентных векторов смещения.

Чтобы задать одно и то же значение для всех векторов, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

`InputWeightsL2Factor` - L2 коэффициент регуляризации для входных весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

L2 регуляризационный коэффициент для весов входа, заданный как числовой скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальный коэффициент регуляризации L2, чтобы определить L2 коэффициент регуляризации для входных весов слоя. Для примера, если InputWeightsL2Factor равен 2, тогда коэффициент регуляризации L2 для входных весов слоя вдвое превышает текущий глобальный коэффициент регуляризации L2. Программа определяет коэффициент регуляризации L2 на основе настроек, заданных в trainingOptions функция.

Чтобы контролировать значение коэффициента регуляризации L2 для трех отдельных матриц в InputWeights, задайте вектор 1 на 3. Записи InputWeightsL2Factor соответствуют L2 коэффициенту регуляризации:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Чтобы задать одно и то же значение для всех матриц, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

`RecurrentWeightsL2Factor` - L2 коэффициент регуляризации для повторяющихся весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

L2 регуляризации для рекуррентных весов, заданный как числовой скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальный коэффициент регуляризации L2, чтобы определить L2 коэффициент регуляризации для повторяющихся весов слоя. Для примера, если RecurrentWeightsL2Factor равен 2, тогда L2 коэффициент регуляризации для повторяющихся весов слоя вдвое превышает текущий глобальный коэффициент регуляризации L2. Программа определяет коэффициент регуляризации L2 на основе настроек, заданных в trainingOptions функция.

Чтобы контролировать значение коэффициента регуляризации L2 для трех отдельных матриц в RecurrentWeights, задайте вектор 1 на 3. Записи RecurrentWeightsL2Factor соответствуют L2 коэффициенту регуляризации:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Чтобы задать одно и то же значение для всех матриц, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

`BiasL2Factor` - L2 коэффициент регуляризации для смещений
0 (по умолчанию) | неотрицательный скаляр | числовой вектор 1 на 3

L2 регуляризации для смещений, заданный как неотрицательный скаляр или числовой вектор 1 на 3.

Программа умножает этот коэффициент на глобальный коэффициент регуляризации L2, чтобы определить L2 регуляризацию для смещений на этом слое. Для примера, если BiasL2Factor равен 2, тогда L2 регуляризация для смещений в этом слое в два раза превышает глобальный коэффициент регуляризации L2. Можно задать глобальный коэффициент регуляризации L2 с помощью trainingOptions функция.

Чтобы управлять значением коэффициента регуляризации L2 для отдельных векторов в Bias, задайте вектор 1 на 3. Записи BiasL2Factor соответствуют L2 коэффициенту регуляризации:

Сбросьте ворота
Обновление ворот
Состояние кандидата

Чтобы задать одно и то же значение для всех векторов, задайте неотрицательный скаляр.

Пример: 2

Пример: [1 2 1]

Слой

`Name` - Имя слоя
`''` (по умолчанию) | символьный вектор | строковый скаляр

Имя слоя, заданное как вектор символов или строковый скаляр. Если Name установлено в ''затем программа автоматически присваивает имя во время обучения.

Типы данных: char | string

`NumInputs` - Количество входов
1 (по умолчанию)

Количество входов слоя. Этот слой принимает только один вход.

Типы данных: double

`InputNames` - Входные имена
`{'in'}` (по умолчанию)

Входные имена слоя. Этот слой принимает только один вход.

Типы данных: cell

`NumOutputs` - Количество выходов
1 (по умолчанию)

Количество выходов слоя. Этот слой имеет только один выход.

Типы данных: double

`OutputNames` - Выходные имена
`{'out'}` (по умолчанию)

Выходные имена слоя. Этот слой имеет только один выход.

Типы данных: cell

Примеры

свернуть все

Создание слоя GRU

Открыть Live Script

Создайте слой GRU с именем 'gru1' и 100 скрытые модули.

layer = gruLayer(100,'Name','gru1')

layer = 
  GRULayer with properties:

                       Name: 'gru1'

   Hyperparameters
                  InputSize: 'auto'
             NumHiddenUnits: 100
                 OutputMode: 'sequence'
    StateActivationFunction: 'tanh'
     GateActivationFunction: 'sigmoid'
              ResetGateMode: 'after-multiplication'

   Learnable Parameters
               InputWeights: []
           RecurrentWeights: []
                       Bias: []

   State Parameters
                HiddenState: []

  Show all properties

Включите слой GRU в Layer массив.

inputSize = 12;
numHiddenUnits = 100;
numClasses = 9;

layers = [ ...
    sequenceInputLayer(inputSize)
    gruLayer(numHiddenUnits)
    fullyConnectedLayer(numClasses)
    softmaxLayer
    classificationLayer]

layers = 
  5x1 Layer array with layers:

     1   ''   Sequence Input          Sequence input with 12 dimensions
     2   ''   GRU                     GRU with 100 hidden units
     3   ''   Fully Connected         9 fully connected layer
     4   ''   Softmax                 softmax
     5   ''   Classification Output   crossentropyex

Подробнее о

расширить все

Затвердевший слой рекуррентных модулей

GRU слоя изучает зависимости между временными шагами во временных рядах и данными последовательности.

Скрытое состояние слоя на временном шаге t содержит выход слоя GRU для этого временного шага. На каждом временном шаге слой добавляет информацию в или удаляет информацию из состояния. Слой управляет этими обновлениями с помощью ворот.

Следующие компоненты управляют скрытым состоянием слоя.

Компонент	Цель
Сбросьте ворота (r)	Управляйте уровнем сброса состояния
Обновление ворот (z)	Управление уровнем обновления состояния
Состояние кандидата ( $\tilde{h}$ )	Управление уровнем обновления, добавленного в скрытое состояние

Обучаемые веса слоя GRU являются входными весами W (InputWeights), периодические веса R (RecurrentWeights), и смещение b (Bias). Если на ResetGateMode свойство 'recurrent-bias-after-multiplication'тогда для вычислений состояния и затвора требуются два набора значений смещения. Матрицы W и R являются конкатенациями входных весов и периодических весов каждого компонента, соответственно. Эти матрицы объединяются следующим образом:

$W = [\begin{matrix} W_{r} \\ W_{z} \\ W_{\tilde{h}} \end{matrix}], R = [\begin{matrix} R_{r} \\ R_{z} \\ R_{\tilde{h}} \end{matrix}],$

где r, z, и $\tilde{h}$ обозначает ворота сброса, ворота обновления и состояние кандидата, соответственно.

Вектор смещения зависит от ResetGateMode свойство. Если ResetGateMode является 'after-mutliplication' или 'before-multiplication', тогда вектор смещения является конкатенацией трех векторов:

$b = [\begin{matrix} b_{W_{r}} \\ b_{W_{z}} \\ b_{W_{\tilde{h}}} \end{matrix}],$

где W индекса указывает, что это смещение, соответствующее умножению входных весов.

Если ResetGateMode является 'recurrent-bias-after-multiplication', тогда вектор смещения является конкатенацией шести векторов:

$b = [\begin{matrix} b_{W_{r}} \\ b_{W_{z}} \\ b_{W_{\tilde{h}}} \\ b_{R_{r}} \\ b_{R_{z}} \\ b_{R_{\tilde{h}}} \end{matrix}],$

где R индекса указывает, что это смещение, соответствующее повторяющемуся умножению весов.

Скрытое состояние во временной шаг t задается как

$h_{t} = (1 - z_{t}) ⊙ {\tilde{h}}_{t} + z_{t} ⊙ h_{t - 1} .$

Следующие формулы описывают компоненты на временном шаге t.

Компонент	`ResetGateMode`	Формула
Сбросьте ворота	`'after-multiplication'`	$r_{t} = σ_{g} (W_{r} x_{t} + b_{W_{r}} + R_{r} h_{t - 1})$
	`'before-multiplication'`	$r_{t} = σ_{g} (W_{r} x_{t} + b_{W_{r}} + R_{r} h_{t - 1})$
	`'recurrent-bias-after-multiplication'`	$r_{t} = σ_{g} (W_{r} x_{t} + b_{W_{r}} + R_{r} h_{t - 1} + b_{R_{r}})$
Обновление ворот	`'after-multiplication'`	$z_{t} = σ_{g} (W_{z} x_{t} + b_{W_{z}} + R_{z} h_{t - 1})$
	`'before-multiplication'`	$z_{t} = σ_{g} (W_{z} x_{t} + b_{W_{z}} + R_{z} h_{t - 1})$
	`'recurrent-bias-after-multiplication'`	$z_{t} = σ_{g} (W_{z} x_{t} + b_{W_{z}} + R_{z} h_{t - 1} + b_{R_{z}})$
Состояние кандидата	`'after-multiplication'`	${\tilde{h}}_{t} = σ_{s} (W_{\tilde{h}} x_{t} + b_{W_{\tilde{h}}} + r_{t} ⊙ (R_{\tilde{h}} h_{t - 1}))$
	`'before-multiplication'`	${\tilde{h}}_{t} = σ_{s} (W_{\tilde{h}} x_{t} + b_{W_{\tilde{h}}} + R_{\tilde{h}} (r_{t} ⊙ h_{t - 1}))$
	`'recurrent-bias-after-multiplication'`	${\tilde{h}}_{t} = σ_{s} (W_{\tilde{h}} x_{t} + b_{W_{\tilde{h}}} + r_{t} ⊙ (R_{\tilde{h}} h_{t - 1} + b_{R_{\tilde{h}}}))$

В этих вычислениях, $σ_{g}$ и $σ_{s}$ обозначает функции управления ключами и активации состояний, соответственно. The gruLayer функция по умолчанию использует сигмоидную функцию, заданную как $σ (x) = {(1 + e^{- x})}^{- 1}$ вычислить функцию активации затвора и гиперболическую тангенциальную функцию (tanh) для вычисления функции активации состояния. Чтобы задать состояние и функции активации ворот, используйте StateActivationFunction и GateActivationFunction свойства, соответственно.

Ссылки

[1] Cho, Kyunghyun, Bart Van Merriénboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, и Yoshua Bengio. «Ознакомление с представлениями фразы с использованием RNN-декодера для статистического машинного перевода». arXiv preprint arXiv:1406.1078 (2014).

[2] Глорот, Ксавьер и Йошуа Бенгио. «Понимание сложности обучения нейронных сетей с глубоким Feedforward». В работе тринадцатой Международной конференции по искусственному интеллекту и статистике, 249-356. Сардиния, Италия: AISTATS, 2010.

[3] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. «Delving Deep Into Rectifiers: Overpassing Human-Level Performance on ImageNet Classification». В работе Международной конференции IEEE по компьютерному зрению 2015 года, 1026-1034. Вашингтон, округ Колумбия: IEEE Компьютерное Зрение Society, 2015.

[4] Saxe, Andrew M., James L. McClelland, and Surya Ganguli. «Точные решения нелинейной динамики обучения в глубоких линейных нейронных сетях» .arXiv preprint arXiv:1312.6120 (2013).

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Указания и ограничения по применению:

The StateActivationFunction свойство должно быть установлено в 'tanh'.
The GateActivationFunction свойство должно быть установлено в 'sigmoid'.
The ResetGateMode свойство должно быть установлено в 'after-multiplication' или 'recurrent-bias-after-multiplication'.

Генерация кода GPU
Сгенерируйте код CUDA ® для графических процессоров NVIDIA ® с помощью GPU Coder™

Указания и ограничения по применению:

The StateActivationFunction свойство должно быть установлено в 'tanh'.
The GateActivationFunction свойство должно быть установлено в 'sigmoid'.
The ResetGateMode свойство должно быть установлено в 'after-multiplication' или 'recurrent-bias-after-multiplication'.

См. также

Темы

Введенный в R2020a

Документация

gruLayer

Описание

Создание

Синтаксис

Описание

Свойства

ГРУ

NumHiddenUnits - Количество скрытых модулей положительное целое число

OutputMode - Формат выхода 'sequence' (по умолчанию) | 'last'

ResetGateMode - Сброс режима управления ключами 'after-multiplication' (по умолчанию) | 'before-multiplication' | 'recurrent-bias-after-multiplication'

InputSize - Вход сигнала 'auto' (по умолчанию) | положительное целое число

Активации

StateActivationFunction - Функция активации для обновления скрытого состояния 'tanh' (по умолчанию) | 'softsign'

GateActivationFunction - Функция активации для применения к воротам 'sigmoid' (по умолчанию) | 'hard-sigmoid'

Государство

HiddenState - Начальное значение скрытого состояния числовой вектор

Параметры и инициализация

InputWeightsInitializer - Функция для инициализации входных весов 'glorot' (по умолчанию) | 'he' | 'orthogonal' | 'narrow-normal' | 'zeros' | 'ones' | указатель на функцию

RecurrentWeightsInitializer - Функция для инициализации повторяющихся весов 'orthogonal' (по умолчанию) | 'glorot' | 'he' | 'narrow-normal' | 'zeros' | 'ones' | указатель на функцию

BiasInitializer - Функция для инициализации смещения 'zeros' (по умолчанию) | 'narrow-normal' | 'ones' | указатель на функцию

InputWeights - Входные веса [] (по умолчанию) | матрица

RecurrentWeights - Периодические веса [] (по умолчанию) | матрица

Bias - Смещения слоев [] (по умолчанию) | числовой вектор

Темп обучения и регуляризация

InputWeightsLearnRateFactor - Коэффициент скорости обучения для входных весов 1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

RecurrentWeightsLearnRateFactor - Коэффициент скорости обучения для периодических весов 1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

BiasLearnRateFactor - Коэффициент скорости обучения для смещений 1 (по умолчанию) | неотрицательный скаляр | числовым вектором 1 на 3

InputWeightsL2Factor - L2 коэффициент регуляризации для входных весов 1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

RecurrentWeightsL2Factor - L2 коэффициент регуляризации для повторяющихся весов 1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

BiasL2Factor - L2 коэффициент регуляризации для смещений 0 (по умолчанию) | неотрицательный скаляр | числовой вектор 1 на 3

Слой

Name - Имя слоя '' (по умолчанию) | символьный вектор | строковый скаляр

NumInputs - Количество входов 1 (по умолчанию)

InputNames - Входные имена {'in'} (по умолчанию)

NumOutputs - Количество выходов 1 (по умолчанию)

OutputNames - Выходные имена {'out'} (по умолчанию)

Примеры

Создание слоя GRU

Подробнее о

Затвердевший слой рекуррентных модулей

Ссылки

Расширенные возможности

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Генерация кода GPU Сгенерируйте код CUDA ® для графических процессоров NVIDIA ® с помощью GPU Coder™

См. также

Темы

Документация по Deep Learning Toolbox

Поддержка

`NumHiddenUnits` - Количество скрытых модулей
положительное целое число

`OutputMode` - Формат выхода
`'sequence'` (по умолчанию) | `'last'`

`ResetGateMode` - Сброс режима управления ключами
`'after-multiplication'` (по умолчанию) | `'before-multiplication'` | `'recurrent-bias-after-multiplication'`

`InputSize` - Вход сигнала
`'auto'` (по умолчанию) | положительное целое число

`StateActivationFunction` - Функция активации для обновления скрытого состояния
`'tanh'` (по умолчанию) | `'softsign'`

`GateActivationFunction` - Функция активации для применения к воротам
`'sigmoid'` (по умолчанию) | `'hard-sigmoid'`

`HiddenState` - Начальное значение скрытого состояния
числовой вектор

`InputWeightsInitializer` - Функция для инициализации входных весов
`'glorot'` (по умолчанию) | `'he'` | `'orthogonal'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

`RecurrentWeightsInitializer` - Функция для инициализации повторяющихся весов
`'orthogonal'` (по умолчанию) | `'glorot'` | `'he'` | `'narrow-normal'` | `'zeros'` | `'ones'` | указатель на функцию

`BiasInitializer` - Функция для инициализации смещения
`'zeros'` (по умолчанию) | `'narrow-normal'` | `'ones'` | указатель на функцию

`InputWeights` - Входные веса
`[]` (по умолчанию) | матрица

`RecurrentWeights` - Периодические веса
`[]` (по умолчанию) | матрица

`Bias` - Смещения слоев
`[]` (по умолчанию) | числовой вектор

`InputWeightsLearnRateFactor` - Коэффициент скорости обучения для входных весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

`RecurrentWeightsLearnRateFactor` - Коэффициент скорости обучения для периодических весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

`BiasLearnRateFactor` - Коэффициент скорости обучения для смещений
1 (по умолчанию) | неотрицательный скаляр | числовым вектором 1 на 3

`InputWeightsL2Factor` - L2 коэффициент регуляризации для входных весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

`RecurrentWeightsL2Factor` - L2 коэффициент регуляризации для повторяющихся весов
1 (по умолчанию) | числовой скаляр | числовым вектором 1 на 3

`BiasL2Factor` - L2 коэффициент регуляризации для смещений
0 (по умолчанию) | неотрицательный скаляр | числовой вектор 1 на 3

`Name` - Имя слоя
`''` (по умолчанию) | символьный вектор | строковый скаляр

`NumInputs` - Количество входов
1 (по умолчанию)

`InputNames` - Входные имена
`{'in'}` (по умолчанию)

`NumOutputs` - Количество выходов
1 (по умолчанию)

`OutputNames` - Выходные имена
`{'out'}` (по умолчанию)

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Генерация кода GPU
Сгенерируйте код CUDA ® для графических процессоров NVIDIA ® с помощью GPU Coder™