Нормируйте данные через все каналы для каждого наблюдения независимо
Операция нормализации слоя нормирует входные данные через все каналы для каждого наблюдения независимо. Чтобы ускорить обучение текущих и многоуровневых perceptron нейронных сетей и уменьшать чувствительность к сетевой инициализации, используйте нормализацию слоя после learnable операций, таких как LSTM и полностью соедините операции.
После нормализации операция переключает вход learnable смещением β и масштабирует его learnable масштабным коэффициентом γ.
layernorm функция применяет операцию нормализации слоя к dlarray данные. Используя dlarray объекты делают работу с высокими размерными данными легче, позволяя вам пометить размерности. Например, можно пометить, которому размерности соответствуют пространственный, время, канал, и обрабатывают размерности в пакетном режиме с помощью "S"TC, и "B" метки, соответственно. Для незаданных и других размерностей используйте "U" метка. Для dlarray возразите функциям, которые действуют по конкретным размерностям, можно задать метки размерности путем форматирования dlarray возразите непосредственно, или при помощи DataFormat опция.
Примечание
Применять нормализацию слоя в layerGraph объект или Layer массив, используйте layerNormalizationLayer.
применяет операцию нормализации слоя к входным данным dlY = layernorm(dlX,offset,scaleFactor)dlX и преобразовывает его с помощью заданного смещения и масштабного коэффициента.
Функция нормирует по 'S' (пространственный), 'T' (время), 'C' (канал) и 'U' (незаданные) размерности dlX для каждого наблюдения в 'B' (пакетная) размерность, независимо.
Для бесформатных входных данных используйте 'DataFormat' опция.
применяет операцию нормализации слоя к бесформатному dlY = layernorm(dlX,offset,scaleFactor,'DataFormat',FMT)dlarray объект dlX с форматом, заданным FMT. Выход dlY бесформатный dlarray объект с размерностями в том же порядке как dlX. Например, 'DataFormat','SSCB' задает данные для 2D входа изображений с форматом 'SSCB' (пространственный, пространственный, канал, пакет).
Чтобы задать формат шкалы и возместить, используйте 'ScaleFormat' и 'OffsetFormat' опции, соответственно.
[ задает опции с помощью одного или нескольких аргументов пары "имя-значение" в дополнение к входным параметрам в предыдущих синтаксисах. Например, dlY] = layernorm(___,Name,Value)'Epsilon',1e-4 устанавливает значение эпсилона к 1e-4.
Операция нормализации слоя нормирует элементы xi входа первым вычислением среднего μL и отклонения σL2 по пространственному, время и размерности канала для каждого наблюдения независимо. Затем это вычисляет нормированные активации как
где ϵ является константой, которая улучшает числовую устойчивость, когда отклонение очень мало.
Допускать возможность, что входные параметры с нулевым средним значением и модульным отклонением не оптимальны для операций, которые следуют за нормализацией слоя, операция нормализации слоя дальнейшие сдвиги и масштабируют активации с помощью преобразования
где смещение β и масштабный коэффициент, γ является настраиваемыми параметрами, которые обновляются во время сетевого обучения.
[1] Ba, Джимми Лэй, Джейми Райан Кирос и Джеффри Э. Хинтон. “Нормализация слоя”. Предварительно распечатайте, представленный 21 июля 2016. https://arxiv.org/abs/1607.06450.
relu | fullyconnect | dlconv | dlarray | dlgradient | dlfeval | groupnorm | batchnorm