pix2pixHDGlobalGenerator

Создайте pix2pixHD глобальную генераторную сеть

Синтаксис

net = pix2pixHDGlobalGenerator(inputSize)

net = pix2pixHDGlobalGenerator(inputSize,Name,Value)

Описание

net = pix2pixHDGlobalGenerator(inputSize) создает сеть pix2pixHD генератора для входа размера inputSize. Для получения дополнительной информации об архитектуре сети смотрите pix2pixHD Generator Network.

Эта функция требует Deep Learning Toolbox™.

пример

net = pix2pixHDGlobalGenerator(inputSize,Name,Value) изменяет свойства pix2pixHD сети с помощью аргументов имя-значение.

Примеры

свернуть все

Создайте Pix2PixHD генератор

Этот пример использует:

Открыть Live Script

Задайте размер входа сети для 32-канальных данных размера 512 на 1024 пикселей.

inputSize = [512 1024 32];

Создайте pix2pixHD глобальную генераторную сеть.

net = pix2pixHDGlobalGenerator(inputSize)

net = 
  dlnetwork with properties:

         Layers: [84x1 nnet.cnn.layer.Layer]
    Connections: [92x2 table]
     Learnables: [110x3 table]
          State: [0x3 table]
     InputNames: {'GlobalGenerator_inputLayer'}
    OutputNames: {'GlobalGenerator_fActivation'}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Создайте Pix2PixHD генератор с нормализацией партии .

Этот пример использует:

Открыть Live Script

Задайте размер входа сети для 32-канальных данных размера 512 на 1024 пикселей.

inputSize = [512 1024 32];

Создайте сеть генератора pix2pixHD, которая выполняет нормализацию партии . после каждой свертки.

net = pix2pixHDGlobalGenerator(inputSize,"Normalization","batch")

net = 
  dlnetwork with properties:

         Layers: [84x1 nnet.cnn.layer.Layer]
    Connections: [92x2 table]
     Learnables: [110x3 table]
          State: [54x3 table]
     InputNames: {'GlobalGenerator_inputLayer'}
    OutputNames: {'GlobalGenerator_fActivation'}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Входные параметры

свернуть все

`inputSize` - Размер входа сети
3-элементный вектор положительных целых чисел

Размер входа сети, заданный как 3-элементный вектор положительных целых чисел. inputSize имеет вид [H W C], где H - высота, W - ширина, а C - количество каналов.

Пример: [28 28 3] задает размер входа 28 на 28 пикселей для трехканального изображения.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'NumFiltersInFirstBlock',32 создает сеть с 32 фильтрами в первом слое свертки

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

Количество блоков понижающей дискретизации в модуле сетевого энкодера, заданное в виде положительного целого числа. В общей сложности сеть понижает вход в 2 ^ NumDownsamplingBlocks. Модуль декодера состоит из того же количества блоков повышающей дискретизации.

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

Количество фильтров в первом слое свертки, заданное как положительное четное целое число.

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

Количество выхода каналов, заданное в виде положительного целого числа.

`'FilterSizeInFirstAndLastBlocks'` - Размер фильтра в первом и последнем слоях свертки
`7` (по умолчанию) | положительное нечетное целое число | 2-элементный вектор положительных нечетных целых чисел

Размер фильтра в первом и последнем слоях свертки сети, заданный как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. Когда вы задаете размер фильтра как скаляр, фильтр имеет равные высоту и ширину.

`'FilterSizeInIntermediateBlocks'` - Размер фильтра в промежуточных слоях
`3` (по умолчанию) | 2-элементный вектор положительных нечетных целых чисел | положительное нечетное целое число

Размер фильтра в промежуточных слоях, заданный как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. Промежуточные слои свертки являются слоями свертки, исключающими первый и последний слой свертки. Когда вы задаете размер фильтра как скаляр, фильтр имеет одинаковые высоту и ширину. Типичные значения находятся между 3 и 7.

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

Количество остаточных блоков, заданное как положительное целое число.

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

Стиль заполнения, используемый в сети, задается как одно из следующих значений.

`PaddingValue`	Описание	Пример
Числовой скаляр	Панель с заданным числовым значением	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 3 & 1 & 4 & 2 & 2 \\ 2 & 2 & 1 & 5 & 9 & 2 & 2 \\ 2 & 2 & 2 & 6 & 5 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \end{matrix}]$
`'symmetric-include-edge'`	Заполните используя зеркальные значения входов, включая значения ребер	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 5 & 1 & 1 & 5 & 9 & 9 & 5 \\ 1 & 3 & 3 & 1 & 4 & 4 & 1 \\ 1 & 3 & 3 & 1 & 4 & 4 & 1 \\ 5 & 1 & 1 & 5 & 9 & 9 & 5 \\ 6 & 2 & 2 & 6 & 5 & 5 & 6 \\ 6 & 2 & 2 & 6 & 5 & 5 & 6 \\ 5 & 1 & 1 & 5 & 9 & 9 & 5 \end{matrix}]$
`'symmetric-exclude-edge'`	Заполните используя зеркальные значения входов, исключая значения ребер	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 5 & 6 & 2 & 6 & 5 & 6 & 2 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 4 & 1 & 3 & 1 & 4 & 1 & 3 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 5 & 6 & 2 & 6 & 5 & 6 & 2 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 4 & 1 & 3 & 1 & 4 & 1 & 3 \end{matrix}]$
`'replicate'`	Заполните с использованием повторяющихся элементов границы входов	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 1 & 1 & 1 & 5 & 9 & 9 & 9 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \end{matrix}]$

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

Метод, используемый для увеличения активации, заданный как одно из следующих значений:

"transposedConv" - Использовать transposedConv2dLayer (Deep Learning Toolbox) с шагом [2 2]
"bilinearResize" - Использование convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует resize2dLayer со шкалой [2 2]
"pixelShuffle" - Использование convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует depthToSpace2dLayer с размером блока [2 2]

Типы данных: char | string

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функции

Инициализация веса, используемая в слоях свертки, задается как "glorot", "he", "narrow-normal", или указатель на функцию. Для получения дополнительной информации смотрите Задать Пользовательскую Функцию Инициализации Веса (Deep Learning Toolbox).

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

Функция активации для использования в сети, заданная в качестве одного из следующих значений. Для получения дополнительной информации и списка доступных слоев смотрите Слои активации (Deep Learning Toolbox).

"relu" - Использование reluLayer (Deep Learning Toolbox)
"leakyRelu" - Использование leakyReluLayer (Deep Learning Toolbox) с масштабным коэффициентом 0,2
"elu" - Использование eluLayer (Deep Learning Toolbox)
Объект слоя

`'FinalActivationLayer'` - Функция активации после окончательной свертки
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

Функция активации после последнего слоя свертки, заданная в качестве одного из следующих значений. Для получения дополнительной информации и списка доступных слоев смотрите Выходные слои (Deep Learning Toolbox).

"tanh" - Использование tanhLayer (Deep Learning Toolbox)
"sigmoid" - Использование sigmoidLayer (Deep Learning Toolbox)
"softmax" - Использование softmaxLayer (Deep Learning Toolbox)
"none" - Не используйте слой окончательной активации
Объект слоя

`'NormalizationLayer'` - Нормализация операции
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объекта слоя

Операция нормализации для использования после каждой свертки, заданная в качестве одного из следующих значений. Для получения дополнительной информации и списка доступных слоев смотрите Normalization, Dropout и Curpping Layers (Deep Learning Toolbox).

"instance" - Использование instanceNormalizationLayer (Deep Learning Toolbox)
"batch" - Использование batchNormalizationLayer (Deep Learning Toolbox)
"none" - Не используйте слой нормализации
Объект слоя

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в области значений [0, 1]

Вероятность отсева, заданная как число в области значений [0, 1]. Если вы задаете значение 0, тогда сеть не включает слои отсева. Если вы задаете значение, больше 0, затем сеть включает в себя dropoutLayer (Deep Learning Toolbox) в каждом остаточном блоке.

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строку | вектор символов

Префикс ко всем именам слоев в сети, заданный как строковый или символьный вектор.

Типы данных: char | string

Выходные аргументы

свернуть все

`net` - pix2pixHD сети генератора
`dlnetwork` объект

Pix2pixHD генераторную сеть, возвращенную как dlnetwork (Deep Learning Toolbox) объект.

Подробнее о

свернуть все

pix2pixHD сети генератора

Сеть генератора pix2pixHD состоит из модуля энкодера, за которым следует модуль декодера. Сеть по умолчанию соответствует архитектуре, предложенной Wang et. al. [1].

Модуль энкодера уменьшает вход в 2 ^ NumDownsamplingBlocks. Модуль энкодера состоит из начального блока слоев, NumDownsamplingBlocks блоки понижающей дискретизации и NumResidualBlocks остаточные блоки. Модуль декодера увеличивает вход в множитель 2 ^ NumDownsamplingBlocks. Модуль декодера состоит из NumDownsamplingBlocks блоки повышающей дискретизации и конечный блок.

Таблица описывает блоки слоев, которые состоят из модулей энкодера и декодера.

Тип блока	Слои	Схема блока по умолчанию
Начальный блок	Система координат `imageInputLayer` (Deep Learning Toolbox) A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks` Дополнительный слой нормализации, заданный `NormalizationLayer` аргумент имя-значение. Слой активации, заданный как `ActivationLayer` аргумент имя-значение.
Блок понижающей дискретизации	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [2 2] для выполнения понижающей дискретизации. Слой свертки имеет размер фильтра `FilterSizeInIntermediateBlocks`. Дополнительный слой нормализации, заданный `NormalizationLayer` аргумент имя-значение. Слой активации, заданный как `ActivationLayer` аргумент имя-значение.
Остаточный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInIntermediateBlocks`. Дополнительный слой нормализации, заданный `NormalizationLayer` аргумент имя-значение. Слой активации, заданный как `ActivationLayer` аргумент имя-значение. Необязательный `dropoutLayer` (Deep Learning Toolbox). По умолчанию остаточные блоки опускают выпадающий слой. Включите слой выпадения путем определения `Dropout` аргумент имя-значение как значение в области значений (0, 1]. Второй `convolution2dLayer` (Deep Learning Toolbox). Необязательный второй слой нормализации. Система координат `additionLayer` (Deep Learning Toolbox), который обеспечивает пропускное соединение между каждым блоком.
Блок повышающей дискретизации	Слой повышающей дискретизации, который повышается в 2 раза согласно `UpsampleMethod` аргумент имя-значение. Слой свертки имеет размер фильтра `FilterSizeInIntermediateBlocks`. Дополнительный слой нормализации, заданный `NormalizationLayer` аргумент имя-значение. Слой активации, заданный как `ActivationLayer` аргумент имя-значение.
Конечный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks`. Необязательный слой активации, заданный `FinalActivationLayer` аргумент имя-значение.

Совет

Вы можете создать сеть дискриминатора для pix2pixHD с помощью patchGANDiscriminator функция.
Обучите pix2pixHD сеть GAN с помощью пользовательского цикла обучения.

Ссылки

[1] Ван, Тин-Чун, Мин-Ю Лю, Цзюнь-Янь Чжу, Эндрю Тао, Ян Каутц и Брайан Катандзаро. «Синтез изображений в высоком разрешении и семантическая манипуляция с условными GAN». В 2018 году IEEE/CVF Conference on Компьютерное Зрение and Pattern Recognition, 8798-8807. Солт-Лейк-Сити, ЮТ, США: IEEE, 2018. https://doi.org/10.1109/CVPR.2018.00917.

См. также

addPix2PixHDLocalEnhancer | blockedNetwork | cycleGANGenerator | encoderDecoderNetwork | unitGenerator

Темы

Введенный в R2021a

Документация

pix2pixHDGlobalGenerator

Синтаксис

Описание

Примеры

Создайте Pix2PixHD генератор

Создайте Pix2PixHD генератор с нормализацией партии .

Входные параметры

`inputSize` - Размер входа сети
3-элементный вектор положительных целых чисел

Аргументы в виде пар имя-значение

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функции

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

`'FinalActivationLayer'` - Функция активации после окончательной свертки
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

`'NormalizationLayer'` - Нормализация операции
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объекта слоя

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в области значений [0, 1]

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строку | вектор символов

Выходные аргументы

`net` - pix2pixHD сети генератора
`dlnetwork` объект

Подробнее о

pix2pixHD сети генератора

Совет

Ссылки

См. также

Темы

Документация по Image Processing Toolbox

Поддержка

Документация

pix2pixHDGlobalGenerator

Синтаксис

Описание

Примеры

Создайте Pix2PixHD генератор

Создайте Pix2PixHD генератор с нормализацией партии .

Входные параметры

inputSize - Размер входа сети 3-элементный вектор положительных целых чисел

Аргументы в виде пар имя-значение

'NumDownsamplingBlocks' - Количество блоков понижающей дискретизации 4 (по умолчанию) | положительное целое число

'NumFiltersInFirstBlock' - Количество фильтров в первом слое свертки 64 (по умолчанию) | положительное четное целое число

'NumOutputChannels' - Количество выходных каналов 3 (по умолчанию) | положительное целое число

'NumResidualBlocks' - Количество остаточных блоков 9 (по умолчанию) | положительное целое число

'ConvolutionPaddingValue' - Стиль заполнения "symmetric-exclude-edge" (по умолчанию) | "symmetric-include-edge" | "replicate" | числовой скаляр

'UpsampleMethod' - Метод, используемый для повышения активации "transposedConv" (по умолчанию) | "bilinearResize" | "pixelShuffle"

'ConvolutionWeightsInitializer' - Массовая инициализация, используемая в слоях "narrow-normal" (по умолчанию) | "glorot" | "he" | функции

'ActivationLayer' - Функция активации "relu" (по умолчанию) | "leakyRelu" | "elu" | объекта слоя

'FinalActivationLayer' - Функция активации после окончательной свертки "tanh" (по умолчанию) | "sigmoid" | "softmax" | "none" | объекта слоя

'NormalizationLayer' - Нормализация операции "instance" (по умолчанию) | "none" | "batch" | объекта слоя

'Dropout' - Вероятность отсева 0 (по умолчанию) | число в области значений [0, 1]

'NamePrefix' - Префикс ко всем именам слоев "GlobalGenerator_" (по умолчанию) | строку | вектор символов

Выходные аргументы

net - pix2pixHD сети генератора dlnetwork объект

Подробнее о

pix2pixHD сети генератора

Совет

Ссылки

См. также

Темы

Документация по Image Processing Toolbox

Поддержка

`inputSize` - Размер входа сети
3-элементный вектор положительных целых чисел

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`4` (по умолчанию) | положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

`'NumOutputChannels'` - Количество выходных каналов
`3` (по умолчанию) | положительное целое число

`'NumResidualBlocks'` - Количество остаточных блоков
`9` (по умолчанию) | положительное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"narrow-normal"` (по умолчанию) | `"glorot"` | `"he"` | функции

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

`'FinalActivationLayer'` - Функция активации после окончательной свертки
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

`'NormalizationLayer'` - Нормализация операции
`"instance"` (по умолчанию) | `"none"` | `"batch"` | объекта слоя

`'Dropout'` - Вероятность отсева
`0` (по умолчанию) | число в области значений [0, 1]

`'NamePrefix'` - Префикс ко всем именам слоев
`"GlobalGenerator_"` (по умолчанию) | строку | вектор символов

`net` - pix2pixHD сети генератора
`dlnetwork` объект