batchNormalizationLayer

Пакетный слой нормализации

Описание

Пакетный слой нормализации нормирует каждый входной канал через мини-пакет. Чтобы ускорить обучение сверточных нейронных сетей и уменьшать чувствительность к сетевой инициализации, используйте пакетные слои нормализации между сверточными слоями и нелинейностью, такой как слои ReLU.

Слой сначала нормирует активации каждого канала путем вычитания мини-пакетного среднего значения и деления на мини-пакетное стандартное отклонение. Затем слой переключает вход learnable смещением β и масштабирует его learnable масштабным коэффициентом γ.

Создание

Синтаксис

layer = batchNormalizationLayer

layer = batchNormalizationLayer('Name',Value)

Описание

layer = batchNormalizationLayer создает пакетный слой нормализации.

пример

layer = batchNormalizationLayer('Name',Value) создает пакетный слой нормализации и устанавливает дополнительную Пакетную Нормализацию, Параметры и Инициализацию, Изучите Уровень и Регуляризацию и свойства Name с помощью пар "имя-значение". Например, batchNormalizationLayer('Name','batchnorm') создает пакетный слой нормализации с именем 'batchnorm'. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в одинарные кавычки.

Свойства

развернуть все

Пакетная нормализация

`TrainedMean` — Введите среднее значение
числовой массив

Введите среднее значение каждого канала, заданного как числовой массив размера 1 1 NumChannels для 2D входа или 1 1 1 NumChannels для 3-D входа.

После сетевых учебных концов программное обеспечение вычисляет входное среднее значение по целому обучающему набору данных. Слой использует TrainedMean (вместо мини-пакетного среднего значения), чтобы нормировать вход во время прогноза.

`TrainedVariance` — Введите отклонение
числовой массив

Введите отклонение каждого канала, заданного как числовой массив размера 1 1 NumChannels для 2D входа или 1 1 1 NumChannels для 3-D входа.

После сетевых учебных концов программное обеспечение вычисляет входное отклонение по целому обучающему набору данных. Слой использует TrainedVariance (вместо мини-пакетного отклонения), чтобы нормировать вход во время прогноза.

`\epsilon` Постоянный, чтобы добавить к мини-пакетным отклонениям
`1e-5` (значение по умолчанию) | числовой скаляр

Постоянный, чтобы добавить к мини-пакетным отклонениям, заданным в виде числа, равняются или больше, чем 1e-5.

Пакетный слой нормализации добавляет эту константу в мини-пакетные отклонения перед нормализацией, чтобы гарантировать числовую устойчивость и избежать деления на нуль.

`NumChannels` — Количество входных каналов
`'auto'` (значение по умолчанию) | положительное целое число

Количество входных каналов, заданных как 'auto' или положительное целое число.

Это свойство всегда равно количеству каналов входа к слою. Если NumChannels равняется 'auto', то программное обеспечение выводит правильное значение для количества каналов в учебное время.

Параметры и инициализация

`ScaleInitializer` — Функция, чтобы инициализировать масштабные коэффициенты канала
`'ones'` (значение по умолчанию) | `'zeros'` | `'narrow-normal'` | указатель на функцию

Функция, чтобы инициализировать масштабные коэффициенты канала, заданные как одно из следующего:

единицы Инициализируйте масштабные коэффициенты канала с единицами.
нули Инициализируйте масштабные коэффициенты канала с нулями.
'narrow-normal' – Инициализируйте масштабные коэффициенты канала путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
Указатель на функцию – Инициализирует масштабные коэффициенты канала с пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму scale = func(sz), где sz является размером шкалы. Для примера смотрите, Задают Пользовательскую Функцию Инициализации Веса.

Слой только инициализирует масштабные коэффициенты канала, когда свойство Scale пусто.

Типы данных: char | string | function_handle

`OffsetInitializer` — Функция, чтобы инициализировать смещения канала
`'zeros'` (значение по умолчанию) | `'ones'` | `'narrow-normal'` | указатель на функцию

Функция, чтобы инициализировать смещения канала, заданные как одно из следующего:

нули Инициализируйте смещения канала с нулями.
единицы Инициализируйте смещения канала с единицами.
'narrow-normal' – Инициализируйте смещения канала путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
Указатель на функцию – Инициализирует смещения канала с пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму offset = func(sz), где sz является размером шкалы. Для примера смотрите, Задают Пользовательскую Функцию Инициализации Веса.

Слой только инициализирует смещения канала, когда свойство Offset пусто.

Типы данных: char | string | function_handle

`Шкала` Масштабные коэффициенты канала
`[]` (значение по умолчанию) | числовой массив

Масштабные коэффициенты канала γ, заданный как числовой массив.

Масштабными коэффициентами канала являются learnable параметры. При обучении сети, если Scale непуст, то trainNetwork использует свойство Scale в качестве начального значения. Если Scale пуст, то trainNetwork использует инициализатор, заданный ScaleInitializer.

В учебное время:

Для 2D входа Scale является 1 1 NumChannels массивом положительных чисел.
Для 3-D входа Scale является 1 1 1 NumChannels массивом положительных чисел.

`Offset` — Смещения канала
`[]` (значение по умолчанию) | числовой массив

Канал смещает β, заданный как числовой массив.

Смещения канала являются learnable параметрами. При обучении сети, если Offset непуст, то trainNetwork использует свойство Offset в качестве начального значения. Если Offset пуст, то trainNetwork использует инициализатор, заданный OffsetInitializer.

В учебное время:

Для 2D входа Offset является 1 1 NumChannels массивом.
Для 3-D входа Offset является 1 1 1 NumChannels массивом.

Изучите уровень и регуляризацию

`ScaleLearnRateFactor` — Фактор темпа обучения для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор темпа обучения для масштабных коэффициентов, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный темп обучения, чтобы определить темп обучения для масштабных коэффициентов в слое. Например, если ScaleLearnRateFactor равняется 2, то темп обучения для масштабных коэффициентов в слое является дважды текущим глобальным темпом обучения. Программное обеспечение определяет глобальный темп обучения на основе настроек, заданных с функцией trainingOptions.

`OffsetLearnRateFactor` — Фактор темпа обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Фактор темпа обучения для смещений, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный темп обучения, чтобы определить темп обучения для смещений в слое. Например, если OffsetLearnRateFactor равняется 2, то темп обучения для смещений в слое является дважды текущим глобальным темпом обучения. Программное обеспечение определяет глобальный темп обучения на основе настроек, заданных с функцией trainingOptions.

`ScaleL2Factor` — Фактор регуляризации _L2 для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор регуляризации _L2 для масштабных коэффициентов, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации _L2, чтобы определить темп обучения для масштабных коэффициентов в слое. Например, если ScaleL2Factor равняется 2, то регуляризация _L2 для смещений в слое является дважды глобальным фактором регуляризации _L2. Можно задать глобальный фактор регуляризации _L2 использование функции trainingOptions.

`OffsetL2Factor` — Фактор регуляризации _L2 для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Фактор регуляризации _L2 для смещений, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации _L2, чтобы определить темп обучения для смещений в слое. Например, если OffsetL2Factor равняется 2, то регуляризация _L2 для смещений в слое является дважды глобальным фактором регуляризации _L2. Можно задать глобальный фактор регуляризации _L2 использование функции trainingOptions.

Слой

`Имя` Имя слоя
`''` (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

Имя слоя, заданное как вектор символов или скаляр строки. Чтобы включать слой в график слоя, необходимо задать непустое уникальное имя слоя. Если вы обучаете серийную сеть со слоем, и Name установлен в '', то программное обеспечение автоматически присваивает имя к слою в учебное время.

Типы данных: char | string

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

Количество входных параметров слоя. Этот слой принимает один вход только.

Типы данных: double

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

Введите имена слоя. Этот слой принимает один вход только.

Типы данных: cell

`NumOutputs` Количество выходных параметров
1 (значение по умолчанию)

Количество выходных параметров слоя. Этот слой имеет один вывод только.

Типы данных: double

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Выведите имена слоя. Этот слой имеет один вывод только.

Типы данных: cell

Примеры

свернуть все

Создайте пакетный слой нормализации

Попробовать в MATLAB

Создайте пакетный слой нормализации с именем 'BN1'.

layer = batchNormalizationLayer('Name','BN1')

layer = 
  BatchNormalizationLayer with properties:

               Name: 'BN1'
        NumChannels: 'auto'
        TrainedMean: []
    TrainedVariance: []

   Hyperparameters
            Epsilon: 1.0000e-05

   Learnable Parameters
             Offset: []
              Scale: []

  Show all properties

Включайте пакетные слои нормализации в массив Layer.

layers = [
    imageInputLayer([32 32 3]) 
  
    convolution2dLayer(3,16,'Padding',1)
    batchNormalizationLayer
    reluLayer   
    
    maxPooling2dLayer(2,'Stride',2)
    
    convolution2dLayer(3,32,'Padding',1)
    batchNormalizationLayer
    reluLayer
          
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer
    ]

layers = 
  11x1 Layer array with layers:

     1   ''   Image Input             32x32x3 images with 'zerocenter' normalization
     2   ''   Convolution             16 3x3 convolutions with stride [1  1] and padding [1  1  1  1]
     3   ''   Batch Normalization     Batch normalization
     4   ''   ReLU                    ReLU
     5   ''   Max Pooling             2x2 max pooling with stride [2  2] and padding [0  0  0  0]
     6   ''   Convolution             32 3x3 convolutions with stride [1  1] and padding [1  1  1  1]
     7   ''   Batch Normalization     Batch normalization
     8   ''   ReLU                    ReLU
     9   ''   Fully Connected         10 fully connected layer
    10   ''   Softmax                 softmax
    11   ''   Classification Output   crossentropyex

Больше о

развернуть все

Пакетный слой нормализации

Пакетные слои нормализации нормируют распространение активаций и градиентов через нейронную сеть, делая сетевое обучение более легкой задачей оптимизации. Чтобы в полной мере воспользоваться этим фактом, можно попытаться увеличить темп обучения. Поскольку задача оптимизации легче, обновления параметра могут быть больше, и сеть может учиться быстрее. Можно также попытаться уменьшать регуляризация уволенного и _L2. С пакетными слоями нормализации зависят активации определенного изображения во время обучения, на котором изображения, оказывается, появляются в том же мини-пакете. Чтобы в полной мере воспользоваться этим эффектом упорядочивания, попытайтесь переставить данные тренировки перед каждой учебной эпохой. Чтобы задать, как часто переставить данные во время обучения, используйте аргумент пары "имя-значение" 'Shuffle' trainingOptions.

Алгоритмы

Пакетная нормализация нормирует свои входные параметры _xi первым вычислением среднего _μB и отклонения _σB2 по мини-пакету и по каждому входному каналу. Затем это вычисляет нормированные активации как

$\hat{x_{i}} = \frac{x_{i} - μ_{B}}{\sqrt{σ_{B}^{2} + ϵ}} .$

Здесь, ϵ (свойство Epsilon) улучшает числовую устойчивость, когда мини-пакетное отклонение является очень небольшим. Допускать возможность, что входные параметры с нулевым средним значением и модульным отклонением не оптимальны для слоя, который следует за пакетным слоем нормализации, пакетный слой нормализации дальнейшие сдвиги и масштабирует активации как

$y_{i} = γ {\hat{x}}_{i} + β .$

Здесь, смещение β и масштабный коэффициент, γ (свойства Offset и Scale) является learnable параметрами, которые обновляются во время сетевого обучения.

Когда сетевое обучение заканчивается, пакетный слой нормализации вычисляет среднее значение и отклонение по полному набору обучающих данных и хранит их в свойствах TrainedMean и TrainedVariance. Когда вы используете обучивший сеть, чтобы сделать прогнозы на новых изображениях, слой использует обученное среднее значение и отклонение вместо мини-пакетного среднего значения и отклонение, чтобы нормировать активации.

Ссылки

[1] Иоффе, Сергей и Кристиан Сзеджеди. "Пакетная нормализация: Ускорение глубокого сетевого обучения путем сокращения внутреннего ковариационного сдвига". предварительно распечатайте, arXiv:1502.03167 (2015).

Документация

batchNormalizationLayer

Описание

Создание

Синтаксис

Описание

Свойства

Пакетная нормализация

`TrainedMean` — Введите среднее значение
числовой массив

`TrainedVariance` — Введите отклонение
числовой массив

`\epsilon` Постоянный, чтобы добавить к мини-пакетным отклонениям
`1e-5` (значение по умолчанию) | числовой скаляр

`NumChannels` — Количество входных каналов
`'auto'` (значение по умолчанию) | положительное целое число

Параметры и инициализация

`ScaleInitializer` — Функция, чтобы инициализировать масштабные коэффициенты канала
`'ones'` (значение по умолчанию) | `'zeros'` | `'narrow-normal'` | указатель на функцию

`OffsetInitializer` — Функция, чтобы инициализировать смещения канала
`'zeros'` (значение по умолчанию) | `'ones'` | `'narrow-normal'` | указатель на функцию

`Шкала` Масштабные коэффициенты канала
`[]` (значение по умолчанию) | числовой массив

`Offset` — Смещения канала
`[]` (значение по умолчанию) | числовой массив

Изучите уровень и регуляризацию

`ScaleLearnRateFactor` — Фактор темпа обучения для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetLearnRateFactor` — Фактор темпа обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`ScaleL2Factor` — Фактор регуляризации _L2 для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetL2Factor` — Фактор регуляризации _L2 для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Слой

`Имя` Имя слоя
`''` (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

`NumOutputs` Количество выходных параметров
1 (значение по умолчанию)

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Примеры

Создайте пакетный слой нормализации

Больше о

Пакетный слой нормализации

Алгоритмы

Ссылки

Смотрите также

Темы

Введенный в R2017b

Документация Deep Learning Toolbox

Поддержка

Документация

batchNormalizationLayer

Описание

Создание

Синтаксис

Описание

Свойства

Пакетная нормализация

TrainedMean — Введите среднее значение числовой массив

TrainedVariance — Введите отклонение числовой массив

\epsilon Постоянный, чтобы добавить к мини-пакетным отклонениям 1e-5 (значение по умолчанию) | числовой скаляр

NumChannels — Количество входных каналов 'auto' (значение по умолчанию) | положительное целое число

Параметры и инициализация

ScaleInitializer — Функция, чтобы инициализировать масштабные коэффициенты канала 'ones' (значение по умолчанию) | 'zeros' | 'narrow-normal' | указатель на функцию

OffsetInitializer — Функция, чтобы инициализировать смещения канала 'zeros' (значение по умолчанию) | 'ones' | 'narrow-normal' | указатель на функцию

Шкала Масштабные коэффициенты канала [] (значение по умолчанию) | числовой массив

Offset — Смещения канала [] (значение по умолчанию) | числовой массив

Изучите уровень и регуляризацию

ScaleLearnRateFactor — Фактор темпа обучения для масштабных коэффициентов 1 (значение по умолчанию) | неотрицательный скаляр

OffsetLearnRateFactor — Фактор темпа обучения для смещений 1 (значение по умолчанию) | неотрицательный скаляр

ScaleL2Factor — Фактор регуляризации L2 для масштабных коэффициентов 1 (значение по умолчанию) | неотрицательный скаляр

OffsetL2Factor — Фактор регуляризации L2 для смещений 1 (значение по умолчанию) | неотрицательный скаляр

Слой

Имя Имя слоя '' (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

NumInputs — Количество входных параметров 1 (значение по умолчанию)

InputNames — Введите имена {'in'} (значение по умолчанию)

NumOutputs Количество выходных параметров 1 (значение по умолчанию)

OutputNames — Выведите имена {'out'} (значение по умолчанию)

Примеры

Создайте пакетный слой нормализации

Больше о

Пакетный слой нормализации

Алгоритмы

Ссылки

Смотрите также

Темы

Введенный в R2017b

Документация Deep Learning Toolbox

Поддержка

`TrainedMean` — Введите среднее значение
числовой массив

`TrainedVariance` — Введите отклонение
числовой массив

`\epsilon` Постоянный, чтобы добавить к мини-пакетным отклонениям
`1e-5` (значение по умолчанию) | числовой скаляр

`NumChannels` — Количество входных каналов
`'auto'` (значение по умолчанию) | положительное целое число

`ScaleInitializer` — Функция, чтобы инициализировать масштабные коэффициенты канала
`'ones'` (значение по умолчанию) | `'zeros'` | `'narrow-normal'` | указатель на функцию

`OffsetInitializer` — Функция, чтобы инициализировать смещения канала
`'zeros'` (значение по умолчанию) | `'ones'` | `'narrow-normal'` | указатель на функцию

`Шкала` Масштабные коэффициенты канала
`[]` (значение по умолчанию) | числовой массив

`Offset` — Смещения канала
`[]` (значение по умолчанию) | числовой массив

`ScaleLearnRateFactor` — Фактор темпа обучения для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetLearnRateFactor` — Фактор темпа обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`ScaleL2Factor` — Фактор регуляризации _L2 для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetL2Factor` — Фактор регуляризации _L2 для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`Имя` Имя слоя
`''` (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

`NumOutputs` Количество выходных параметров
1 (значение по умолчанию)

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)