Нормируйте каждый канал мини-пакета
Операция нормализации партии. нормирует каждый входной канал через мини-пакет. Чтобы ускорить обучение сверточных нейронных сетей и уменьшать чувствительность к сетевой инициализации, используйте нормализацию партии. между сверткой и нелинейными операциями такой как relu
.
Примечание
Эта функция применяет операцию нормализации партии. к dlarray
данные. Если вы хотите применить нормализацию партии. в layerGraph
объект или Layer
массив, используйте следующий слой:
[
нормирует каждый канал входного мини-пакета dlY
,mu
,sigmaSq
] = batchnorm(dlX
,offset
,scaleFactor
)dlX
использование среднего значения и статистики отклонения, вычисленной из каждого канала и, применяет масштабный коэффициент и смещение.
Нормированная активация вычисляется с помощью следующей формулы:
где xi является входной активацией, μc (mu
) и σc2 (sigmaSq
) среднее значение на канал и отклонение, соответственно, и ε является маленькой константой. mu
и sigmaSq
вычисляются по всему 'S'
(пространственный), 'B'
(пакет), 'T'
(время) и 'U'
(незаданные) размерности в dlX
для каждого канала.
Нормированная активация возмещается и масштабируется согласно следующей формуле:
Смещение β и масштабный коэффициент γ задано с offset
и scaleFactor
аргументы.
Вход dlX
отформатированный dlarray
с метками размерности. Выход dlY
отформатированный dlarray
с той же размерностью помечает как dlX
.
[
нормирует каждый канал входного мини-пакета dlY
,datasetMu
,datasetSigmaSq
] = batchnorm(dlX
,offset
,scaleFactor
,datasetMu
,datasetSigmaSq
)dlX
использование среднего значения и статистики отклонения, вычисленной из каждого канала и, применяет масштабный коэффициент и смещение. Функция также обновляет статистику набора данных datasetMu
и datasetSigmaSq
использование следующей формулы:
где sn является статистической величиной, вычисленной по нескольким мини-пакетам, sx является статистической величиной на канал текущего мини-пакета, и ϕ является значением затухания для статистической величины.
Используйте этот синтаксис, чтобы итеративно обновить среднее значение и статистику отклонения по нескольким мини-пакетам данных во время обучения. Используйте окончательное значение среднего значения и отклонения, вычисленного по всем учебным мини-пакетам, чтобы нормировать данные для предсказания и классификации.
[___] = batchnorm(___,'DataFormat',FMT)
также задает формат размерности FMT
когда dlX
не отформатированный dlarray
в дополнение к входным параметрам в предыдущих синтаксисах. Выход dlY
бесформатный dlarray
с той же размерностью заказывают как dlX
.
[___] = batchnorm(___,
задает опции с помощью одного или нескольких аргументов пары "имя-значение" в дополнение к входным параметрам в предыдущих синтаксисах. Например, Name,Value
)'MeanDecay',3
устанавливает уровень затухания расчета скользящего среднего значения.
dlarray
| dlconv
| dlfeval
| dlgradient
| fullyconnect
| groupnorm
| relu