Нормализовать каждый канал для каждого наблюдения независимо
Операция нормализации экземпляра нормализует входные данные по каждому каналу для каждого наблюдения независимо. Чтобы улучшить сходимость тренировки сверточной нейронной сети и снизить чувствительность к гиперпараметрам сети, используйте нормализацию экземпляра между сверткой и нелинейными операциями, такими как relu.
После нормализации операция сдвигает вход на обучаемый сдвиг β и масштабирует его на обучаемый масштабный коэффициент γ.
instancenorm функция применяет операцию нормализации уровня к dlarray данные. Используя dlarray объекты упрощают работу с высокоразмерными данными, позволяя маркировать размеры. Например, можно пометить, какие измерения соответствуют пространственным, временным, канальным и пакетным измерениям, используя 'S', 'T', 'C', и 'B' соответственно. Для неуказанных и других размеров используйте 'U' этикетка. Для dlarray функции объекта, которые работают над определенными размерами, можно указать метки размеров, отформатировав dlarray непосредственно или с помощью 'DataFormat' вариант.
Примечание
Применение нормализации экземпляра в пределах layerGraph объект или Layer массив, использование instanceNormalizationLayer.
применяет операцию нормализации экземпляра к входным данным dlY = instancenorm(dlX,offset,scaleFactor)dlX и преобразует с использованием указанного смещения и масштабного коэффициента.
Функция нормализуется по сгруппированным подмножествам 'S' (пространственный), 'T' (время), и 'U' (неуказанные) размеры dlX для каждого наблюдения в 'C' (канал) и 'B' (партии) размеры, независимо.
Для неформатированных входных данных используйте 'DataFormat' вариант.
применяет операцию нормализации экземпляра к неформатированному dlY = instancenorm(dlX,offset,scaleFactor,'DataFormat',FMT)dlarray объект dlX с форматом, указанным FMT с использованием любого из предыдущих синтаксисов. Продукция dlY является неформатированным dlarray объект с размерами в том же порядке, что и dlX. Например, 'DataFormat','SSCB' задает данные для 2-D ввода изображения в формате 'SSCB' (пространственный, пространственный, канальный, пакетный).
указывает параметры, использующие один или несколько аргументов пары имя-значение в дополнение к входным аргументам в предыдущих синтаксисах. Например, dlY = instancenorm(___Name,Value)'Epsilon',3e-5 устанавливает смещение расхождения в 3e-5.
Операция нормализации экземпляра нормализует элементы xi входного сигнала, сначала вычисляя среднее мкI и σI2 дисперсии по пространственным и временным измерениям для каждого канала в каждом наблюдении независимо. Затем он вычисляет нормализованные активации как
где ϵ - константа, которая улучшает числовую стабильность, когда дисперсия очень мала.
Чтобы обеспечить возможность того, что входные данные с нулевым средним и единичной дисперсией не являются оптимальными для операций, которые следуют за нормализацией экземпляра, операция нормализации экземпляра дополнительно сдвигает и масштабирует активации с помощью преобразования
i + β,
где смещение β и масштабный коэффициент γ являются обучаемыми параметрами, которые обновляются во время обучения сети.
batchnorm | dlarray | dlconv | dlfeval | dlgradient | fullyconnect | groupnorm | layernorm | relu