pix2pixHDGlobalGenerator

Создание глобальной сети генераторов pix2pixHD

Синтаксис

net = pix2pixHDGlobalGenerator (inputSize)

net = pix2pixHDGlobalGenerator (inputSize, Name, Value)

Описание

net = pix2pixHDGlobalGenerator(inputSize) создает сеть генератора pix2pixHD для ввода размера inputSize. Дополнительные сведения об архитектуре сети см. в разделе Сеть генератора pix2pixHD.

Для выполнения этой функции требуется Toolbox™ глубокого обучения.

пример

net = pix2pixHDGlobalGenerator(inputSize,Name,Value) изменяет свойства pix2pixHD сети с помощью аргументов «имя-значение».

Примеры

свернуть все

Создать генератор Pix2PixHD

В этом примере используются:

Открыть сценарий в реальном времени

Укажите размер сетевого входа для 32-канальных данных размером 512 на 1024 пикселей.

inputSize = [512 1024 32];

Создание pix2pixHD глобальной сети генераторов.

net = pix2pixHDGlobalGenerator(inputSize)

net = 
  dlnetwork with properties:

         Layers: [84x1 nnet.cnn.layer.Layer]
    Connections: [92x2 table]
     Learnables: [110x3 table]
          State: [0x3 table]
     InputNames: {'GlobalGenerator_inputLayer'}
    OutputNames: {'GlobalGenerator_fActivation'}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Создание генератора Pix2PixHD с нормализацией партии

В этом примере используются:

Открыть сценарий в реальном времени

Укажите размер сетевого входа для 32-канальных данных размером 512 на 1024 пикселей.

inputSize = [512 1024 32];

Создайте сеть генератора pix2pixHD, которая выполняет пакетную нормализацию после каждого свертывания.

net = pix2pixHDGlobalGenerator(inputSize,"Normalization","batch")

net = 
  dlnetwork with properties:

         Layers: [84x1 nnet.cnn.layer.Layer]
    Connections: [92x2 table]
     Learnables: [110x3 table]
          State: [54x3 table]
     InputNames: {'GlobalGenerator_inputLayer'}
    OutputNames: {'GlobalGenerator_fActivation'}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Входные аргументы

свернуть все

`inputSize` - Размер сетевого входа
3-элементный вектор положительных целых чисел

Размер сетевого входа, заданный как 3-элементный вектор положительных целых чисел. inputSize имеет вид [H W C], где H - высота, W - ширина, а C - количество каналов.

Пример: [28 28 3] задает размер ввода для 3-канального изображения 28 на 28 пикселей.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'NumFiltersInFirstBlock',32 создает сеть с 32 фильтрами в первом слое свертки

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

Количество блоков понижающей дискретизации в модуле сетевого кодера, указанное как положительное целое число. В целом, сеть понижает входной сигнал в 2 разаNumDownsamplingBlocks. Модуль декодера состоит из одинакового количества блоков повышающей дискретизации.

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное целое число

Число фильтров в первом слое свертки, указанное как положительное четное целое число.

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

Число выходных каналов, указанное как положительное целое число.

`'FilterSizeInFirstAndLastBlocks'` - Размер фильтра в первом и последнем слоях свертки
`7` (по умолчанию) | положительное нечетное целое | 2-элементный вектор положительных нечетных целых чисел

Размер фильтра в первом и последнем слоях свертки сети, определяемый как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. При указании размера фильтра как скаляра фильтр имеет одинаковую высоту и ширину.

`'FilterSizeInIntermediateBlocks'` - Размер фильтра в промежуточных слоях свертки
`3` (по умолчанию) | 2-элементный вектор положительных нечётных чисел | положительное нечётное целое

Размер фильтра в промежуточных слоях свертки, определяемый как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. Промежуточными слоями свертки являются слои свертки, исключая первый и последний слои свертки. При указании размера фильтра как скаляра, фильтр имеет одинаковую высоту и ширину. Типичные значения находятся в диапазоне от 3 до 7.

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

Количество остаточных блоков, указанное как положительное целое число.

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

Стиль заполнения, используемый в сети, указанный как одно из этих значений.

`PaddingValue`	Описание	Пример
Числовой скаляр	Площадка с указанным числовым значением	$\begin{matrix} \end{matrix} \begin{matrix} \end{matrix} [314159265]\to[2222222222222222314222215922222652222222222222222]$
`'symmetric-include-edge'`	Pad с использованием зеркальных значений входных данных, включая значения краев	$\begin{matrix} \end{matrix} \begin{matrix} \end{matrix} [314159265]\to[5115995133144113314415115995622655662265565115995]$
`'symmetric-exclude-edge'`	Прокладка с использованием зеркальных значений входных данных, за исключением краевых значений	$\begin{matrix} \end{matrix} \begin{matrix} \end{matrix} [314159265]\to[5626562951595141314139515951562656295159514131413]$
`'replicate'`	Прокладка с использованием повторяющихся граничных элементов ввода	$\begin{matrix} \end{matrix} \begin{matrix} \end{matrix} [314159265]\to[3331444333144433314441115999222655522265552226555]$

`'UpsampleMethod'` - Метод, используемый для увеличения количества активаций
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

Метод, используемый для увеличения числа активаций, указанный как одно из следующих значений:

"transposedConv" - Использовать transposedConv2dLayer (Deep Learning Toolbox) с шагом [2 2]
"bilinearResize" - Использовать convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует resize2dLayer с масштабом [2 2]
"pixelShuffle" - Использовать convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует depthToSpace2dLayer с размером блока [2 2]

Типы данных: char | string

`'ConvolutionWeightsInitializer'` - Инициализация веса, используемая в слоях свертки
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функция

Инициализация веса, используемая в слоях свертки, указанная как "glorot", "he", "narrow-normal"или дескриптор функции. Дополнительные сведения см. в разделе Определение пользовательской функции инициализации веса (панель инструментов глубокого обучения).

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объект-слой

Функция активации для использования в сети, указанная как одно из этих значений. Дополнительные сведения и список доступных слоев см. в разделе Слои активации (панель инструментов глубокого обучения).

"relu" - Использовать reluLayer (инструментарий для глубокого обучения)
"leakyRelu" - Использовать leakyReluLayer (Deep Learning Toolbox) с масштабным коэффициентом 0,2
"elu" - Использовать eluLayer (инструментарий для глубокого обучения)
Объект слоя

`'FinalActivationLayer'` - Функция активации после окончательного свертывания
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объект-слой

Функция активации после конечного слоя свертки, заданная как одно из этих значений. Дополнительные сведения и список доступных слоев см. в разделе Выходные слои (панель инструментов глубокого обучения).

"tanh" - Использовать tanhLayer (инструментарий для глубокого обучения)
"sigmoid" - Использовать sigmoidLayer (инструментарий для глубокого обучения)
"softmax" - Использовать softmaxLayer (инструментарий для глубокого обучения)
"none" - Не использовать окончательный уровень активации
Объект слоя

`'NormalizationLayer'` - Операция нормализации
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объект-слой

Операция нормализации, используемая после каждой свертки, заданная как одно из этих значений. Дополнительные сведения и список доступных слоев см. в разделах Нормализация, Отсев и Обрезка слоев (Панель инструментов глубокого обучения).

"instance" - Использовать instanceNormalizationLayer (инструментарий для глубокого обучения)
"batch" - Использовать batchNormalizationLayer (инструментарий для глубокого обучения)
"none" - Не использовать уровень нормализации
Объект слоя

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в диапазоне [0, 1]

Вероятность отсева, указанная как число в диапазоне [0, 1]. Если указано значение 0, то сеть не включает уровни отсева. Если указано значение больше, чем 0, то сеть включает в себя dropoutLayer (Deep Learning Toolbox) в каждом остаточном блоке.

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строка | символьный вектор

Префикс ко всем именам слоев в сети, заданный как строковый или символьный вектор.

Типы данных: char | string

Выходные аргументы

свернуть все

`net` - сеть генератора pix2pixHD
`dlnetwork` объект

Pix2pixHD генераторная сеть, возвращенная как dlnetwork(Панель инструментов глубокого обучения).

Подробнее

свернуть все

pix2pixHD Сеть генератора

Сеть генераторов pix2pixHD состоит из модуля кодера, за которым следует модуль декодера. Сеть по умолчанию соответствует архитектуре, предложенной Wang et. al. [1].

Модуль кодера понижает выборку входного сигнала на коэффициент 2 ^NumDownsamplingBlocks. Модуль кодера состоит из начального блока слоев, NumDownsamplingBlocks блоки понижающей дискретизации и NumResidualBlocks остаточные блоки. Модуль декодера увеличивает входной сигнал на коэффициент 2 ^NumDownsamplingBlocks. Модуль декодера состоит из: NumDownsamplingBlocks блоки повышающей дискретизации и конечный блок.

Таблица описывает блоки уровней, которые содержат модули кодера и декодера.

Тип блока	Слои	Схема блока по умолчанию
Начальный блок	Один `imageInputLayer` (инструментарий для глубокого обучения) A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks` Необязательный уровень нормализации, заданный параметром `NormalizationLayer` аргумент «имя-значение». Уровень активации, указанный `ActivationLayer` аргумент «имя-значение».
Блок понижающей дискретизации	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [2 2] для выполнения понижающей дискретизации. Сверточный слой имеет размер фильтра `FilterSizeInIntermediateBlocks`. Необязательный уровень нормализации, заданный параметром `NormalizationLayer` аргумент «имя-значение». Уровень активации, указанный `ActivationLayer` аргумент «имя-значение».
Остаточный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInIntermediateBlocks`. Необязательный уровень нормализации, заданный параметром `NormalizationLayer` аргумент «имя-значение». Уровень активации, указанный `ActivationLayer` аргумент «имя-значение». Дополнительное `dropoutLayer` (инструментарий глубокого обучения). По умолчанию остаточные блоки пропускают слой отсева. Включить слой отсева, указав `Dropout` аргумент «имя-значение» в качестве значения в диапазоне (0, 1]. Секунда `convolution2dLayer` (инструментарий глубокого обучения). Дополнительный второй уровень нормализации. Один `additionLayer` (Deep Learning Toolbox), которая обеспечивает пропуск соединения между каждым блоком.
Блок повышающей дискретизации	Повышающий дискретизирующий слой, который увеличивает выборку в 2 раза согласно `UpsampleMethod` аргумент «имя-значение». Сверточный слой имеет размер фильтра `FilterSizeInIntermediateBlocks`. Необязательный уровень нормализации, заданный параметром `NormalizationLayer` аргумент «имя-значение». Уровень активации, указанный `ActivationLayer` аргумент «имя-значение».
Окончательный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks`. Необязательный уровень активации, указанный `FinalActivationLayer` аргумент «имя-значение».

Совет

Сеть дискриминаторов для pix2pixHD можно создать с помощью patchGANDiscriminator функция.
Обучите сеть pix2pixHD GAN, используя таможенную учебную петлю.

Ссылки

[1] Ван, Тин-Чунь, Мин-Ю Лю, Цзюнь-Янь Чжу, Эндрю Тао, Ян Каутц и Брайан Катандзаро. «Синтез изображений высокого разрешения и семантическая манипуляция с условными GAN». В 2018 году Конференция IEEE/CVF по компьютерному зрению и распознаванию образов, 8798-8807. Солт-Лейк-Сити, УТ, США: IEEE, 2018. https://doi.org/10.1109/CVPR.2018.00917.

См. также

addPix2PixHDLocalEnhancer | blockedNetwork | cycleGANGenerator | encoderDecoderNetwork | unitGenerator

Темы

Создание изображения на основе карты сегментации с помощью глубокого обучения (панель инструментов компьютерного зрения)
Начало работы с GAN для преобразования образа в образ
Создание модульных нейронных сетей
Список слоев глубокого обучения (инструментарий для глубокого обучения)

Представлен в R2021a

Документация

pix2pixHDGlobalGenerator

Синтаксис

Описание

Примеры

Создать генератор Pix2PixHD

Создание генератора Pix2PixHD с нормализацией партии

Входные аргументы

`inputSize` - Размер сетевого входа
3-элементный вектор положительных целых чисел

Аргументы пары «имя-значение»

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное целое число

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

`'FilterSizeInIntermediateBlocks'` - Размер фильтра в промежуточных слоях свертки
`3` (по умолчанию) | 2-элементный вектор положительных нечётных чисел | положительное нечётное целое

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для увеличения количества активаций
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Инициализация веса, используемая в слоях свертки
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функция

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объект-слой

`'FinalActivationLayer'` - Функция активации после окончательного свертывания
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объект-слой

`'NormalizationLayer'` - Операция нормализации
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объект-слой

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в диапазоне [0, 1]

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строка | символьный вектор

Выходные аргументы

`net` - сеть генератора pix2pixHD
`dlnetwork` объект

Подробнее

pix2pixHD Сеть генератора

Совет

Ссылки

См. также

Темы

Документация по инструментам обработки изображений

Поддержка

Документация

pix2pixHDGlobalGenerator

Синтаксис

Описание

Примеры

Создать генератор Pix2PixHD

Создание генератора Pix2PixHD с нормализацией партии

Входные аргументы

inputSize - Размер сетевого входа 3-элементный вектор положительных целых чисел

Аргументы пары «имя-значение»

'NumDownsamplingBlocks' - Количество блоков понижающей дискретизации 4 (по умолчанию) | положительное целое число

'NumFiltersInFirstBlock' - Количество фильтров в первом слое свертки 64 (по умолчанию) | положительное целое число

'NumOutputChannels' - Количество выходных каналов 3 (по умолчанию) | положительное целое число

'FilterSizeInIntermediateBlocks' - Размер фильтра в промежуточных слоях свертки 3 (по умолчанию) | 2-элементный вектор положительных нечётных чисел | положительное нечётное целое

'NumResidualBlocks' - Количество остаточных блоков 9 (по умолчанию) | положительное целое число

'ConvolutionPaddingValue' - Стиль заполнения "symmetric-exclude-edge" (по умолчанию) | "symmetric-include-edge" | "replicate" | числовой скаляр

'UpsampleMethod' - Метод, используемый для увеличения количества активаций "transposedConv" (по умолчанию) | "bilinearResize" | "pixelShuffle"

'ConvolutionWeightsInitializer' - Инициализация веса, используемая в слоях свертки "narrow-normal" (по умолчанию) | "glorot" | "he" | функция

'ActivationLayer' - Функция активации "relu" (по умолчанию) | "leakyRelu" | "elu" | объект-слой

'FinalActivationLayer' - Функция активации после окончательного свертывания "tanh" (по умолчанию) | "sigmoid" | "softmax" | "none" | объект-слой

'NormalizationLayer' - Операция нормализации "instance" (по умолчанию) | "none" | "batch" | объект-слой

'Dropout' - Вероятность отсева 0 (по умолчанию) | число в диапазоне [0, 1]

'NamePrefix' - Префикс ко всем именам слоев "GlobalGenerator_" (по умолчанию) | строка | символьный вектор

Выходные аргументы

net - сеть генератора pix2pixHD dlnetwork объект

Подробнее

pix2pixHD Сеть генератора

Совет

Ссылки

См. также

Темы

Документация по инструментам обработки изображений

Поддержка

`inputSize` - Размер сетевого входа
3-элементный вектор положительных целых чисел

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное целое число

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для увеличения количества активаций
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Инициализация веса, используемая в слоях свертки
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функция

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объект-слой

`'FinalActivationLayer'` - Функция активации после окончательного свертывания
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объект-слой

`'NormalizationLayer'` - Операция нормализации
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объект-слой

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в диапазоне [0, 1]

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строка | символьный вектор

`net` - сеть генератора pix2pixHD
`dlnetwork` объект