Нормализовать по сгруппированным подмножествам каналов для каждого наблюдения независимо
Операция групповой нормализации нормализует входные данные по сгруппированным подмножествам каналов для каждого наблюдения независимо. Для ускорения обучения сверточной нейронной сети и снижения чувствительности к инициализации сети используйте групповую нормализацию между сверткой и нелинейными операциями, такими как relu.
После нормализации операция сдвигает вход на обучаемый сдвиг β и масштабирует его на обучаемый масштабный коэффициент γ.
groupnorm функция применяет операцию нормализации группы к dlarray данные. Используя dlarray объекты упрощают работу с высокоразмерными данными, позволяя маркировать размеры. Например, можно пометить, какие измерения соответствуют пространственным, временным, канальным и пакетным измерениям, используя 'S', 'T', 'C', и 'B' соответственно. Для неуказанных и других размеров используйте 'U' этикетка. Для dlarray функции объекта, которые работают над определенными размерами, можно указать метки размеров, отформатировав dlarray непосредственно или с помощью 'DataFormat' вариант.
Примечание
Применение нормализации групп в пределах layerGraph объект или Layer массив, использование groupNormalizationLayer.
применяет операцию нормализации группы к входным данным dlY = groupnorm(dlX,numGroups,offset,scaleFactor)dlX использование указанного количества групп и преобразований с использованием указанного смещения и масштабного коэффициента.
Функция нормализуется по сгруппированным подмножествам 'C' (канал) размерность и 'S' (пространственный), 'T' (время), и 'U' (неуказанные) размеры dlX для каждого наблюдения в 'B' (пакетное) измерение, независимо.
Для неформатированных входных данных используйте 'DataFormat' вариант.
применяет операцию нормализации группы к неформатированной dlY = groupnorm(dlX,numGroups,offset,scaleFactor,'DataFormat',FMT)dlarray объект dlX с форматом, указанным FMT с использованием любого из предыдущих синтаксисов. Продукция dlY является неформатированным dlarray объект с размерами в том же порядке, что и dlX. Например, 'DataFormat','SSCB' задает данные для 2-D ввода изображения в формате 'SSCB' (пространственный, пространственный, канальный, пакетный).
указывает параметры, использующие один или несколько аргументов пары имя-значение в дополнение к входным аргументам в предыдущих синтаксисах. Например, dlY = groupnorm(___Name,Value)'Epsilon',3e-5 устанавливает смещение расхождения в 3e-5.
Операция групповой нормализации нормализует элементы xi входного сигнала, сначала вычисляя среднее значение мкG и σG2 дисперсии по пространственным, временным и сгруппированным подмножествам размеров канала для каждого наблюдения независимо. Затем он вычисляет нормализованные активации как
μGσG2 + start,
где ϵ - константа, которая улучшает числовую стабильность, когда дисперсия очень мала. Для обеспечения возможности того, что входы с нулевым средним и единичной дисперсией не являются оптимальными для операций, которые следуют за групповой нормализацией, операция групповой нормализации дополнительно сдвигает и масштабирует активации с помощью преобразования
i + β,
где смещение β и масштабный коэффициент γ являются обучаемыми параметрами, которые обновляются во время обучения сети.
batchnorm | dlarray | dlconv | dlfeval | dlgradient | fullyconnect | instancenorm | layernorm | relu