batchNormalizationLayer

Пакетный слой нормализации

Описание

Пакетный слой нормализации нормирует каждый входной канал через мини-пакет. Чтобы ускорить обучение сверточных нейронных сетей и уменьшать чувствительность к сетевой инициализации, используйте пакетные слои нормализации между сверточными слоями и нелинейностью, такой как слои ReLU.

Слой сначала нормирует активации каждого канала путем вычитания мини-пакетного среднего значения и деления на мини-пакетное стандартное отклонение. Затем слой переключает вход learnable смещением β и масштабирует его learnable масштабным коэффициентом γ.

Создание

Синтаксис

layer = batchNormalizationLayer

layer = batchNormalizationLayer('Name',Value)

Описание

layer = batchNormalizationLayer создает пакетный слой нормализации.

пример

layer = batchNormalizationLayer('Name',Value) создает пакетный слой нормализации и устанавливает дополнительную Пакетную Нормализацию, Параметры и Инициализацию, Изучите Уровень и Регуляризацию и Name свойства с помощью пар "имя-значение". Например, batchNormalizationLayer('Name','batchnorm') создает пакетный слой нормализации с именем 'batchnorm'. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в одинарные кавычки.

Свойства

развернуть все

Пакетная нормализация

`TrainedMean` — Введите среднее значение
числовой массив

Введите среднее значение каждого канала, заданного как числовой массив размера 1 1 NumChannels для 2D входа или 1 1 1 NumChannels для 3-D входа.

После сетевых учебных концов программное обеспечение вычисляет входное среднее значение по целому обучающему набору данных. Слой использует TrainedMean (вместо мини-пакетного среднего значения), чтобы нормировать вход во время прогноза.

`TrainedVariance` — Введите отклонение
числовой массив

Введите отклонение каждого канала, заданного как числовой массив размера 1 1 NumChannels для 2D входа или 1 1 1 NumChannels для 3-D входа.

После сетевых учебных концов программное обеспечение вычисляет входное отклонение по целому обучающему набору данных. Слой использует TrainedVariance (вместо мини-пакетного отклонения), чтобы нормировать вход во время прогноза.

`Epsilon` — Постоянный, чтобы добавить к мини-пакетным отклонениям
`1e-5` (значение по умолчанию) | числовой скаляр

Постоянный, чтобы добавить к мини-пакетным отклонениям, заданным в виде числа, равняются или больше, чем 1e-5.

Пакетный слой нормализации добавляет эту константу в мини-пакетные отклонения перед нормализацией, чтобы гарантировать числовую устойчивость и избежать деления на нуль.

`NumChannels` — Количество входных каналов
`'auto'` (значение по умолчанию) | положительное целое число

Количество входных каналов, заданных как 'auto' или положительное целое число.

Это свойство всегда равно количеству каналов входа к слою. Если NumChannels равняется 'auto', затем программное обеспечение выводит правильное значение для количества каналов в учебное время.

Параметры и инициализация

`ScaleInitializer` — Функция, чтобы инициализировать масштабные коэффициенты канала
`'ones'` (значение по умолчанию) | `'zeros'` | `'narrow-normal'` | указатель на функцию

Функция, чтобы инициализировать масштабные коэффициенты канала, заданные как одно из следующего:

'ones' – Инициализируйте масштабные коэффициенты канала с единицами.
'zeros' – Инициализируйте масштабные коэффициенты канала с нулями.
'narrow-normal' – Инициализируйте масштабные коэффициенты канала путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
Указатель на функцию – Инициализирует масштабные коэффициенты канала с пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму scale = func(sz), где sz размер шкалы. Для примера смотрите, Задают Пользовательскую Функцию Инициализации Веса.

Слой только инициализирует масштабные коэффициенты канала когда Scale свойство пусто.

Типы данных: char | string | function_handle

`OffsetInitializer` — Функция, чтобы инициализировать смещения канала
`'zeros'` (значение по умолчанию) | `'ones'` | `'narrow-normal'` | указатель на функцию

Функция, чтобы инициализировать смещения канала, заданные как одно из следующего:

'zeros' – Инициализируйте смещения канала с нулями.
'ones' – Инициализируйте смещения канала с единицами.
'narrow-normal' – Инициализируйте смещения канала путем независимой выборки от нормального распределения с нулевым средним и стандартным отклонением 0.01.
Указатель на функцию – Инициализирует смещения канала с пользовательской функцией. Если вы задаете указатель на функцию, то функция должна иметь форму offset = func(sz), где sz размер шкалы. Для примера смотрите, Задают Пользовательскую Функцию Инициализации Веса.

Слой только инициализирует смещения канала когда Offset свойство пусто.

Типы данных: char | string | function_handle

`Scale` — Масштабные коэффициенты канала
`[]` (значение по умолчанию) | числовой массив

Масштабные коэффициенты канала γ, заданный как числовой массив.

Масштабными коэффициентами канала являются learnable параметры. При обучении сети, если Scale непусто, затем trainNetwork использует Scale свойство как начальное значение. Если Scale пусто, затем trainNetwork использует инициализатор, заданный ScaleInitializer.

В учебное время:

Для 2D входа, Scale 1 1 NumChannels массив положительных чисел.
Для 3-D входа, Scale 1 1 1 NumChannels массив положительных чисел.

`Offset` — Смещения канала
`[]` (значение по умолчанию) | числовой массив

Канал возмещает β, заданный как числовой массив.

Смещения канала являются learnable параметрами. При обучении сети, если Offset непусто, затем trainNetwork использует Offset свойство как начальное значение. Если Offset пусто, затем trainNetwork использует инициализатор, заданный OffsetInitializer.

В учебное время:

Для 2D входа, Offset 1 1 NumChannels массив.
Для 3-D входа, Offset 1 1 1 NumChannels массив.

Изучите уровень и регуляризацию

`ScaleLearnRateFactor` — Фактор темпа обучения для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор темпа обучения для масштабных коэффициентов, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный темп обучения, чтобы определить темп обучения для масштабных коэффициентов в слое. Например, если ScaleLearnRateFactor 2, затем темп обучения для масштабных коэффициентов в слое является дважды текущим глобальным темпом обучения. Программное обеспечение определяет глобальный темп обучения на основе настроек, заданных с trainingOptions функция.

`OffsetLearnRateFactor` — Фактор темпа обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Фактор темпа обучения для смещений, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный темп обучения, чтобы определить темп обучения для смещений в слое. Например, если OffsetLearnRateFactor равняется 2, затем темп обучения для смещений в слое является дважды текущим глобальным темпом обучения. Программное обеспечение определяет глобальный темп обучения на основе настроек, заданных с trainingOptions функция.

`ScaleL2Factor` — Фактор регуляризации _L2 для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

Фактор регуляризации _L2 для масштабных коэффициентов, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации _L2, чтобы определить темп обучения для масштабных коэффициентов в слое. Например, если ScaleL2Factor 2, затем регуляризация _L2 для смещений в слое является дважды глобальным фактором регуляризации _L2. Можно задать глобальный фактор регуляризации _L2 использование trainingOptions функция.

`OffsetL2Factor` — Фактор регуляризации _L2 для смещений
1 (значение по умолчанию) | неотрицательный скаляр

Фактор регуляризации _L2 для смещений, заданных как неотрицательный скаляр.

Программное обеспечение умножает этот фактор на глобальный фактор регуляризации _L2, чтобы определить темп обучения для смещений в слое. Например, если OffsetL2Factor 2, затем регуляризация _L2 для смещений в слое является дважды глобальным фактором регуляризации _L2. Можно задать глобальный фактор регуляризации _L2 использование trainingOptions функция.

Слой

`Name` — Имя слоя
`''` (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

Имя слоя, заданное как вектор символов или скаляр строки. Чтобы включать слой в график слоя, необходимо задать непустое уникальное имя слоя. Если вы обучаете серийную сеть со слоем и Name установлен в '', затем программное обеспечение автоматически присваивает имя к слою в учебное время.

Типы данных: char | string

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

Количество входных параметров слоя. Этот слой принимает один вход только.

Типы данных: double

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

Введите имена слоя. Этот слой принимает один вход только.

Типы данных: cell

`NumOutputs` — Количество выходных параметров
1 (значение по умолчанию)

Количество выходных параметров слоя. Этот слой имеет один выход только.

Типы данных: double

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Выведите имена слоя. Этот слой имеет один выход только.

Типы данных: cell

Примеры

свернуть все

Создайте пакетный слой нормализации

Скрипт Open Live Script

Создайте пакетный слой нормализации с именем 'BN1'.

layer = batchNormalizationLayer('Name','BN1')

layer = 
  BatchNormalizationLayer with properties:

               Name: 'BN1'
        NumChannels: 'auto'
        TrainedMean: []
    TrainedVariance: []

   Hyperparameters
            Epsilon: 1.0000e-05

   Learnable Parameters
             Offset: []
              Scale: []

  Show all properties

Включайте пакетные слои нормализации в Layer массив.

layers = [
    imageInputLayer([32 32 3]) 
  
    convolution2dLayer(3,16,'Padding',1)
    batchNormalizationLayer
    reluLayer   
    
    maxPooling2dLayer(2,'Stride',2)
    
    convolution2dLayer(3,32,'Padding',1)
    batchNormalizationLayer
    reluLayer
          
    fullyConnectedLayer(10)
    softmaxLayer
    classificationLayer
    ]

layers = 
  11x1 Layer array with layers:

     1   ''   Image Input             32x32x3 images with 'zerocenter' normalization
     2   ''   Convolution             16 3x3 convolutions with stride [1  1] and padding [1  1  1  1]
     3   ''   Batch Normalization     Batch normalization
     4   ''   ReLU                    ReLU
     5   ''   Max Pooling             2x2 max pooling with stride [2  2] and padding [0  0  0  0]
     6   ''   Convolution             32 3x3 convolutions with stride [1  1] and padding [1  1  1  1]
     7   ''   Batch Normalization     Batch normalization
     8   ''   ReLU                    ReLU
     9   ''   Fully Connected         10 fully connected layer
    10   ''   Softmax                 softmax
    11   ''   Classification Output   crossentropyex

Больше о

развернуть все

Пакетный слой нормализации

Пакетные слои нормализации нормируют распространение активаций и градиентов через нейронную сеть, делая сетевое обучение более легкой задачей оптимизации. Чтобы в полной мере воспользоваться этим фактом, можно попытаться увеличить темп обучения. Поскольку задача оптимизации легче, обновления параметра могут быть больше, и сеть может учиться быстрее. Можно также попытаться уменьшать регуляризация уволенного и _L2. С пакетными слоями нормализации зависят активации определенного изображения во время обучения, на котором изображения, оказывается, появляются в том же мини-пакете. Чтобы в полной мере воспользоваться этим эффектом упорядочивания, попытайтесь переставить обучающие данные перед каждой учебной эпохой. Чтобы задать, как часто переставить данные во время обучения, используйте 'Shuffle' аргумент пары "имя-значение" trainingOptions.

Алгоритмы

Пакетная нормализация нормирует свои входные параметры _xi первым вычислением среднего _μB и отклонения _σB2 по мини-пакету и по каждому входному каналу. Затем это вычисляет нормированные активации как

$\hat{x_{i}} = \frac{x_{i} - μ_{B}}{\sqrt{σ_{B}^{2} + ϵ}} .$

Здесь, ϵ (свойство Epsilon) улучшает числовую устойчивость, когда мини-пакетное отклонение очень мало. Допускать возможность, что входные параметры с нулевым средним значением и модульным отклонением не оптимальны для слоя, который следует за пакетным слоем нормализации, пакетный слой нормализации дальнейшие сдвиги и масштабирует активации как

$y_{i} = γ {\hat{x}}_{i} + β .$

Здесь, смещение β и масштабный коэффициент γ (Offset и Scale свойства), learnable параметры, которые обновляются во время сетевого обучения.

Когда сетевое обучение заканчивается, пакетный слой нормализации вычисляет среднее значение и отклонение по полному набору обучающих данных и хранит их в TrainedMean и TrainedVariance свойства. Когда вы используете обучивший сеть, чтобы сделать прогнозы на новых изображениях, слой использует обученное среднее значение и отклонение вместо мини-пакетного среднего значения и отклонение, чтобы нормировать активации.

Ссылки

[1] Иоффе, Сергей и Кристиан Сзеджеди. "Пакетная нормализация: Ускорение глубокого сетевого обучения путем сокращения внутреннего ковариационного сдвига". предварительно распечатайте, arXiv:1502.03167 (2015).

Документация

batchNormalizationLayer

Описание

Создание

Синтаксис

Описание

Свойства

Пакетная нормализация

TrainedMean — Введите среднее значение числовой массив

TrainedVariance — Введите отклонение числовой массив

Epsilon — Постоянный, чтобы добавить к мини-пакетным отклонениям 1e-5 (значение по умолчанию) | числовой скаляр

NumChannels — Количество входных каналов 'auto' (значение по умолчанию) | положительное целое число

Параметры и инициализация

ScaleInitializer — Функция, чтобы инициализировать масштабные коэффициенты канала 'ones' (значение по умолчанию) | 'zeros' | 'narrow-normal' | указатель на функцию

OffsetInitializer — Функция, чтобы инициализировать смещения канала 'zeros' (значение по умолчанию) | 'ones' | 'narrow-normal' | указатель на функцию

Scale — Масштабные коэффициенты канала [] (значение по умолчанию) | числовой массив

Offset — Смещения канала [] (значение по умолчанию) | числовой массив

Изучите уровень и регуляризацию

ScaleLearnRateFactor — Фактор темпа обучения для масштабных коэффициентов 1 (значение по умолчанию) | неотрицательный скаляр

OffsetLearnRateFactor — Фактор темпа обучения для смещений 1 (значение по умолчанию) | неотрицательный скаляр

ScaleL2Factor — Фактор регуляризации L2 для масштабных коэффициентов 1 (значение по умолчанию) | неотрицательный скаляр

OffsetL2Factor — Фактор регуляризации L2 для смещений 1 (значение по умолчанию) | неотрицательный скаляр

Слой

Name — Имя слоя '' (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

NumInputs — Количество входных параметров 1 (значение по умолчанию)

InputNames — Введите имена {'in'} (значение по умолчанию)

NumOutputs — Количество выходных параметров 1 (значение по умолчанию)

OutputNames — Выведите имена {'out'} (значение по умолчанию)

Примеры

Создайте пакетный слой нормализации

Больше о

Пакетный слой нормализации

Алгоритмы

Ссылки

Расширенные возможности

Генерация кода графического процессора Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Смотрите также

Темы

Введенный в R2017b

Документация Deep Learning Toolbox

Поддержка

`TrainedMean` — Введите среднее значение
числовой массив

`TrainedVariance` — Введите отклонение
числовой массив

`Epsilon` — Постоянный, чтобы добавить к мини-пакетным отклонениям
`1e-5` (значение по умолчанию) | числовой скаляр

`NumChannels` — Количество входных каналов
`'auto'` (значение по умолчанию) | положительное целое число

`ScaleInitializer` — Функция, чтобы инициализировать масштабные коэффициенты канала
`'ones'` (значение по умолчанию) | `'zeros'` | `'narrow-normal'` | указатель на функцию

`OffsetInitializer` — Функция, чтобы инициализировать смещения канала
`'zeros'` (значение по умолчанию) | `'ones'` | `'narrow-normal'` | указатель на функцию

`Scale` — Масштабные коэффициенты канала
`[]` (значение по умолчанию) | числовой массив

`Offset` — Смещения канала
`[]` (значение по умолчанию) | числовой массив

`ScaleLearnRateFactor` — Фактор темпа обучения для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetLearnRateFactor` — Фактор темпа обучения для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`ScaleL2Factor` — Фактор регуляризации _L2 для масштабных коэффициентов
1 (значение по умолчанию) | неотрицательный скаляр

`OffsetL2Factor` — Фактор регуляризации _L2 для смещений
1 (значение по умолчанию) | неотрицательный скаляр

`Name` — Имя слоя
`''` (значение по умолчанию) | вектор символов | представляет скаляр в виде строки

`NumInputs` — Количество входных параметров
1 (значение по умолчанию)

`InputNames` — Введите имена
`{'in'}` (значение по умолчанию)

`NumOutputs` — Количество выходных параметров
1 (значение по умолчанию)

`OutputNames` — Выведите имена
`{'out'}` (значение по умолчанию)

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.