Нормируйте каждый канал входных данных
Пакетная операция нормализации нормирует каждый входной канал через мини-пакет. Чтобы ускорить обучение сверточных нейронных сетей и уменьшать чувствительность к сетевой инициализации, используйте пакетную нормализацию между сверткой и нелинейными операциями, такими как relu.
Эта функция применяет пакетную операцию нормализации к dlarray данные. Если вы хотите применить пакетную нормализацию в layerGraph объект или Layer массив, используйте следующий слой:
[ нормирует каждый канал входного мини-пакета dlY,mu,sigma] = batchnorm(dlX,offset,scaleFactor)dlX использование среднего значения и статистики отклонения, вычисленной из каждого канала и, применяет масштабный коэффициент и смещение.
Нормированная активация вычисляется с помощью следующей формулы:
где xi является входной активацией, μc (mu) и σc2 (sigma) среднее значение на канал и отклонение, соответственно, и ε является маленькой константой. mu и sigma вычисляются по всему 'S' (пространственный), 'B' (пакет), 'T' (время) и 'U' (незаданные) размерности в dlX для каждого канала.
Нормированная активация возмещается и масштабируется согласно следующей формуле:
Смещение β и масштабный коэффициент γ задано с offset и scaleFactor аргументы.
Вход dlX отформатированный dlarray с метками размерности. Выход dlY отформатированный dlarray с той же размерностью помечает как dlX.
[ нормирует каждый канал входного мини-пакета dlY,datasetMu,datasetSigma] = batchnorm(dlX,offset,scaleFactor,datasetMu,datasetSigma)dlX использование среднего значения и статистики отклонения, вычисленной из каждого канала и, применяет масштабный коэффициент и смещение. Функция также обновляет статистику набора данных datasetMu и datasetSigma использование следующей формулы:
где sn является статистической величиной, вычисленной по нескольким мини-пакетам, sx является статистической величиной на канал текущего мини-пакета, и ϕ является значением затухания для статистической величины.
Используйте этот синтаксис, чтобы итеративно обновить среднее значение и статистику отклонения по нескольким мини-пакетам данных во время обучения. Используйте окончательное значение среднего значения и отклонения, вычисленного по всем учебным мини-пакетам, чтобы нормировать данные для прогноза и классификации.
[___] = batchnorm(___,'DataFormat', также указывает, что размерность маркирует FMT)FMT когда dlX не отформатированный dlarray в дополнение к входным параметрам в предыдущих синтаксисах. Выход dlY бесформатный dlarray с той же размерностью заказывают как dlX.
[___] = batchnorm(___, задает опции с помощью одного или нескольких аргументов пары "имя-значение" в дополнение к входным параметрам в предыдущих синтаксисах. Например, Name,Value)'MeanDecay',3 устанавливает уровень затухания расчета скользящего среднего значения.
dlarray | dlconv | dlfeval | dlgradient | fullyconnect | relu