Независимо нормализовать все каналы для каждого наблюдения
Операция нормализации уровня нормализует входные данные по всем каналам для каждого наблюдения независимо. Чтобы ускорить обучение повторяющихся и многослойных нейронных сетей перцептрона и снизить чувствительность к инициализации сети, используйте нормализацию уровня после обучаемых операций, таких как LSTM, и полностью соединяйте операции.
После нормализации операция сдвигает вход на обучаемый сдвиг β и масштабирует его на обучаемый масштабный коэффициент γ.
layernorm функция применяет операцию нормализации уровня к dlarray данные. Используя dlarray объекты упрощают работу с высокоразмерными данными, позволяя маркировать размеры. Например, можно пометить, какие измерения соответствуют пространственным, временным, канальным и пакетным измерениям, используя 'S', 'T', 'C', и 'B' соответственно. Для неуказанных и других размеров используйте 'U' этикетка. Для dlarray функции объекта, которые работают над определенными размерами, можно указать метки размеров, отформатировав dlarray непосредственно или с помощью 'DataFormat' вариант.
Примечание
Применение нормализации слоев в пределах layerGraph объект или Layer массив, использование layerNormalizationLayer.
применяет операцию нормализации уровня к входным данным dlY = layernorm(dlX,offset,scaleFactor)dlX и преобразует с использованием указанного смещения и масштабного коэффициента.
Функция нормализуется над 'S' (пространственный), 'T' (время), 'C' (канал), и 'U' (неуказанные) размеры dlX для каждого наблюдения в 'B' (пакетное) измерение, независимо.
Для неформатированных входных данных используйте 'DataFormat' вариант.
применяет операцию нормализации слоя к неформатированным dlY = layernorm(dlX,offset,scaleFactor,'DataFormat',FMT)dlarray объект dlX с форматом, указанным FMT с использованием любого из предыдущих синтаксисов. Продукция dlY является неформатированным dlarray объект с размерами в том же порядке, что и dlX. Например, 'DataFormat','SSCB' задает данные для 2-D ввода изображения в формате 'SSCB' (пространственный, пространственный, канальный, пакетный).
Чтобы задать формат масштаба и смещения, используйте 'ScaleFormat' и 'OffsetFormat' соответственно.
[ указывает параметры, использующие один или несколько аргументов пары имя-значение в дополнение к входным аргументам в предыдущих синтаксисах. Например, dlY] = layernorm(___,Name,Value)'Epsilon',1e-4 устанавливает значение эпсилона как 1e-4.
Операция нормализации слоя нормализует элементы xi входного сигнала, сначала вычисляя среднее значение мкл и σL2 дисперсии по пространственным, временным и канальным измерениям для каждого наблюдения независимо. Затем он вычисляет нормализованные активации как
где ϵ - константа, которая улучшает числовую стабильность, когда дисперсия очень мала.
Для обеспечения возможности того, что входные данные с нулевым средним и единичной дисперсией не являются оптимальными для операций, которые следуют за нормализацией уровня, операция нормализации уровня дополнительно сдвигает и масштабирует активации с помощью преобразования.
i + β,
где смещение β и масштабный коэффициент γ являются обучаемыми параметрами, которые обновляются во время обучения сети.
batchnorm | dlarray | dlconv | dlfeval | dlgradient | fullyconnect | groupnorm | relu