Нормируйте данные через все наблюдения для каждого канала независимо
Операция нормализации партии. нормирует входные данные через все наблюдения для каждого канала независимо. Чтобы ускорить обучение сверточной нейронной сети и уменьшать чувствительность к сетевой инициализации, используйте нормализацию партии. между сверткой и нелинейными операциями такой как relu.
После нормализации операция переключает вход learnable смещением β и масштабирует его learnable масштабным коэффициентом γ.
batchnorm функция применяет операцию нормализации партии. к dlarray данные. Используя dlarray объекты делают работу с высокими размерными данными легче, позволяя вам пометить размерности. Например, можно пометить, которому размерности соответствуют пространственный, время, канал, и обрабатывают размерности в пакетном режиме с помощью "S"TC, и "B" метки, соответственно. Для незаданных и других размерностей используйте "U" метка. Для dlarray возразите функциям, которые действуют по конкретным размерностям, можно задать метки размерности путем форматирования dlarray возразите непосредственно, или при помощи DataFormat опция.
Примечание
Применять нормализацию партии. в layerGraph объект или Layer массив, используйте batchNormalizationLayer.
применяет операцию нормализации партии. к входным данным dlY = batchnorm(dlX,offset,scaleFactor)dlX использование среднего значения населения и отклонения входных данных и заданного смещения и масштабного коэффициента.
Функция нормирует по 'S' (пространственный), 'T' (время), 'B' (пакет) и 'U' (незаданные) размерности dlX для каждого канала в 'C' (канал) размерность, независимо.
Для бесформатных входных данных используйте 'DataFormat' опция.
[ применяет операцию нормализации партии. и также возвращает среднее значение населения и отклонение входных данных dlY,popMu,popSigmaSq] = batchnorm(dlX,offset,scaleFactor)dlX.
[ применяет операцию нормализации партии. и также возвращает обновленное скользящее среднее значение и статистику отклонения. dlY,updatedMu,updatedSigmaSq] = batchnorm(dlX,offset,scaleFactor,runningMu,runningSigmaSq)runningMu и runningSigmaSq среднее значение и значения отклонения после предыдущей учебной итерации, соответственно.
Используйте этот синтаксис, чтобы обеспечить рабочие значения для среднего значения и статистики отклонения во время обучения. То, когда вы закончили обучение, используйте финал, обновило значения среднего значения и отклонения для операции нормализации партии. во время предсказания и классификации.
применяет операцию нормализации партии. с помощью среднего dlY = batchnorm(dlX,offset,scaleFactor,trainedMu,trainedSigmaSq)trainedMu и отклонение trainedSigmaSq.
Используйте этот синтаксис во время классификации и предсказания, где trainedMu и trainedSigmaSq окончательные значения среднего значения и отклонения после того, как вы закончили обучение, соответственно.
[___] = batchnorm(___,'DataFormat',FMT) применяет операцию нормализации партии. к бесформатным входным данным с форматом, заданным FMT использование любой из комбинаций ввода или вывода в предыдущих синтаксисах. Выход dlY бесформатный dlarray объект с размерностями в том же порядке как dlX. Например, 'DataFormat','SSCB' задает данные для 2D входа изображений с форматом 'SSCB' (пространственный, пространственный, канал, пакет).
[___] = batchnorm(___, задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение". Например, Name,Value)'MeanDecay',0.3 устанавливает уровень затухания расчета скользящего среднего значения.
Операция нормализации партии. нормирует элементы xi входа первым вычислением среднего μB и отклонения σB2 по пространственному, время и размерности наблюдения для каждого канала независимо. Затем это вычисляет нормированные активации как
где ϵ является константой, которая улучшает числовую устойчивость, когда отклонение очень мало.
Допускать возможность, что входные параметры с нулевым средним значением и модульным отклонением не оптимальны для операций, которые следуют за нормализацией партии., операция нормализации партии. дальнейшие сдвиги и масштабируют активации с помощью преобразования
где смещение β и масштабный коэффициент, γ является настраиваемыми параметрами, которые обновляются во время сетевого обучения.
Чтобы сделать предсказания с сетью после обучения, нормализация партии. требует, чтобы фиксированное среднее значение и отклонение нормировали данные. Это фиксированное среднее значение и отклонение могут быть вычислены от обучающих данных после обучения или аппроксимированы во время использования обучения рабочие статистические расчеты.
relu | fullyconnect | dlconv | dlarray | dlgradient | dlfeval | groupnorm | layernorm