unitGenerator

Создайте неконтролируемую сеть генератора преобразования изображений в изображения (UNIT)

Синтаксис

net = unitGenerator(inputSizeSource)

net = unitGenerator(inputSizeSource,Name,Value)

Описание

net = unitGenerator(inputSizeSource) создает сеть генератора UNIT, net, для входов размера inputSizeSource. Для получения дополнительной информации об архитектуре сети смотрите UNIT Generator Network. Сеть имеет два входа и четыре выхода:

Двумя сетевыми входами являются изображения в исходных и целевых областях. По умолчанию целевой размер изображения совпадает с размером исходного изображения. Вы можете изменить количество каналов в целевом изображении, задав 'NumTargetInputChannels'имя-значение аргумента.
Два сетевых выхода являются самовосстановленными выходами, другими словами, преобразованными изображениями от источника к источнику и от целевого к целевому. Другие два сетевых выхода являются преобразованными изображениями «источник-цель» и «цель-источник».

Эта функция требует Deep Learning Toolbox™.

пример

net = unitGenerator(inputSizeSource,Name,Value) изменяет аспекты сети генератора UNIT с помощью аргументов имя-значение.

Примеры

свернуть все

Создайте генератор UNIT

Этот пример использует:

Попробовать в MATLAB

Укажите размер сетевого входа для изображений RGB размера 128 на 128.

inputSize = [128 128 3];

Создайте генератор UNIT, который генерирует изображения RGB размера входа.

net = unitGenerator(inputSize)

net = 
  dlnetwork with properties:

         Layers: [9x1 nnet.cnn.layer.Layer]
    Connections: [8x2 table]
     Learnables: [168x3 table]
          State: [0x3 table]
     InputNames: {'inputSource'  'inputTarget'}
    OutputNames: {1x4 cell}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Создайте генератор UNIT с пятью остаточными блоками

Этот пример использует:

Попробовать в MATLAB

Укажите размер сетевого входа для изображений RGB размера 128 на 128.

inputSize = [128 128 3];

Создайте генератор UNIT с пятью остаточными блоками, три из которых являются общими между модулями энкодера и декодера.

net = unitGenerator(inputSize,"NumResidualBlocks",5, ...
    "NumSharedBlocks",3)

net = 
  dlnetwork with properties:

         Layers: [9x1 nnet.cnn.layer.Layer]
    Connections: [8x2 table]
     Learnables: [152x3 table]
          State: [0x3 table]
     InputNames: {'inputSource'  'inputTarget'}
    OutputNames: {1x4 cell}
    Initialized: 1

Отображение сети.

analyzeNetwork(net)

Входные параметры

свернуть все

`inputSizeSource` - Входной размер исходного изображения
3-элементный вектор положительных целых чисел

Вход сигнала исходного изображения, заданный как 3-элементный вектор положительных целых чисел. inputSizeSource имеет вид [H W C], где H - высота, W - ширина, а C - количество каналов. Длина каждой размерности должна быть равномерно разделена на 2 ^ NumDownsamplingBlocks.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'NumDownsamplingBlocks',3 создает сеть с 3 блоками понижающей дискретизации

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`2` (по умолчанию) | положительное целое число

Количество блоков понижающей дискретизации в подсетях исходного энкодера и целевого энкодера в виде положительного целого числа. В целом модуль энкодера понижает значение входного и целевого входных параметров в 2 ^ NumDownsamplingBlocks. Исходный декодер и подсеть целевого декодера имеют одинаковое количество блоков повышающей дискретизации.

`'NumResidualBlocks'` - Количество остаточных блоков
`5` (по умолчанию) | положительное целое число

Количество остаточных блоков в модуле энкодера, заданное в виде положительного целого числа. Модуль декодера имеет одинаковое количество остаточных блоков.

`'NumSharedBlocks'` - Количество общих остаточных блоков
`2` (по умолчанию) | положительное целое число

Количество остаточных блоков в подсети общего энкодера, заданное в виде положительного целого числа. Общая подсеть декодера имеет одинаковое количество остаточных блоков. Сеть должна содержать по крайней мере один общий остаточный блок.

`'NumTargetChannels'` - Количество каналов в целевом изображении
положительное целое число

Количество каналов в целевом изображении, заданное как положительное целое число. По умолчанию 'NumTargetChannels'совпадает с количеством каналов в исходном изображении, inputSizeSource.

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

Количество фильтров в первом слое свертки, заданное как положительное четное целое число.

`'FilterSizeInFirstAndLastBlocks'` - Размер фильтра в первом и последнем слоях свертки
`7` (по умолчанию) | положительное нечетное целое число | 2-элементный вектор положительных нечетных целых чисел

Размер фильтра в первом и последнем слоях свертки сети, заданный как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. Когда вы задаете размер фильтра как скаляр, фильтр имеет равные высоту и ширину.

`'FilterSizeInIntermediateBlocks'` - Размер фильтра в промежуточных слоях
`3` (по умолчанию) | 2-элементный вектор положительных нечетных целых чисел | положительное нечетное целое число

Размер фильтра в промежуточных слоях, заданный как положительное нечетное целое или 2-элементный вектор положительных нечетных целых чисел вида [ширина высоты ]. Промежуточные слои свертки являются слоями свертки, исключающими первый и последний слой свертки. Когда вы задаете размер фильтра как скаляр, фильтр имеет одинаковые высоту и ширину.

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

Стиль заполнения, используемый в сети, задается как одно из следующих значений.

`PaddingValue`	Описание	Пример
Числовой скаляр	Панель с заданным числовым значением	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 3 & 1 & 4 & 2 & 2 \\ 2 & 2 & 1 & 5 & 9 & 2 & 2 \\ 2 & 2 & 2 & 6 & 5 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \\ 2 & 2 & 2 & 2 & 2 & 2 & 2 \end{matrix}]$
`'symmetric-include-edge'`	Заполните используя зеркальные значения входов, включая значения ребер	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 5 & 1 & 1 & 5 & 9 & 9 & 5 \\ 1 & 3 & 3 & 1 & 4 & 4 & 1 \\ 1 & 3 & 3 & 1 & 4 & 4 & 1 \\ 5 & 1 & 1 & 5 & 9 & 9 & 5 \\ 6 & 2 & 2 & 6 & 5 & 5 & 6 \\ 6 & 2 & 2 & 6 & 5 & 5 & 6 \\ 5 & 1 & 1 & 5 & 9 & 9 & 5 \end{matrix}]$
`'symmetric-exclude-edge'`	Заполните используя зеркальные значения входов, исключая значения ребер	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 5 & 6 & 2 & 6 & 5 & 6 & 2 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 4 & 1 & 3 & 1 & 4 & 1 & 3 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 5 & 6 & 2 & 6 & 5 & 6 & 2 \\ 9 & 5 & 1 & 5 & 9 & 5 & 1 \\ 4 & 1 & 3 & 1 & 4 & 1 & 3 \end{matrix}]$
`'replicate'`	Заполните с использованием повторяющихся элементов границы входов	$[\begin{matrix} 3 & 1 & 4 \\ 1 & 5 & 9 \\ 2 & 6 & 5 \end{matrix}] \to [\begin{matrix} 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 3 & 3 & 3 & 1 & 4 & 4 & 4 \\ 1 & 1 & 1 & 5 & 9 & 9 & 9 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \\ 2 & 2 & 2 & 6 & 5 & 5 & 5 \end{matrix}]$

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

Метод, используемый для увеличения активации, заданный как одно из следующих значений:

"transposedConv" - Использовать transposedConv2dLayer (Deep Learning Toolbox) с шагом [2 2].
"bilinearResize" - Использование convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует resize2dLayer со шкалой [2 2].
"pixelShuffle" - Использование convolution2dLayer (Deep Learning Toolbox) с шагом [1 1], за которым следует depthToSpace2dLayer с размером блока [2 2].

Типы данных: char | string

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"he"` (по умолчанию) | `"glorot"` | `"narrow-normal"` | функции

Инициализация веса, используемая в слоях свертки, задается как "glorot", "he", "narrow-normal", или указатель на функцию. Для получения дополнительной информации смотрите Задать Пользовательскую Функцию Инициализации Веса (Deep Learning Toolbox).

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

Функция активации для использования в сети за исключением первого и последнего слоев свертки, заданных в качестве одного из следующих значений. unitGenerator функция автоматически добавляет утечку слоя ReLU после первого слоя свертки. Для получения дополнительной информации и списка доступных слоев смотрите Слои активации (Deep Learning Toolbox).

"relu" - Использование reluLayer (Deep Learning Toolbox)
"leakyRelu" - Использование leakyReluLayer (Deep Learning Toolbox) с масштабным коэффициентом 0,2
"elu" - Использование eluLayer (Deep Learning Toolbox)
Объект слоя

`'SourceFinalActivationLayer'` - Функция активации после окончательной свертки в исходном декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

Функция активации после последнего слоя свертки в исходном декодере, заданная в качестве одного из следующих значений. Для получения дополнительной информации и списка доступных слоев смотрите Выходные слои (Deep Learning Toolbox).

"tanh" - Использование tanhLayer (Deep Learning Toolbox)
"sigmoid" - Использование sigmoidLayer (Deep Learning Toolbox)
"softmax" - Использование softmaxLayer (Deep Learning Toolbox)
"none" - Не используйте слой окончательной активации
Объект слоя

`'TargetFinalActivationLayer'` - Функция активации после окончательной свертки в целевом декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

Функция активации после последнего слоя свертки в целевом декодере, заданная в качестве одного из следующих значений. Для получения дополнительной информации и списка доступных слоев смотрите Выходные слои (Deep Learning Toolbox).

"tanh" - Использование tanhLayer (Deep Learning Toolbox)
"sigmoid" - Использование sigmoidLayer (Deep Learning Toolbox)
"softmax" - Использование softmaxLayer (Deep Learning Toolbox)
"none" - Не используйте слой окончательной активации
Объект слоя

Выходные аргументы

свернуть все

`net` - БЛОЧНАЯ генераторная сеть
`dlnetwork` объект

UNIT сеть генератора, возвращенная как dlnetwork (Deep Learning Toolbox) объект.

Подробнее о

свернуть все

Сеть генератора UNIT

Сеть генератора UNIT состоит из трех подсетей в модуле энкодера и затем трех подсетей в модуле декодера. Сеть по умолчанию соответствует архитектуре, предложенной Liu, Breuel и Kautz [1].

Модуль энкодера уменьшает вход в 2 ^ NumDownsamplingBlocks. Модуль энкодера состоит из трех подсетей.

Подсеть исходного энкодера, называемая 'encoderSourceBlock', имеет начальный блок слоев, который принимает данные в исходной области, _XS. Затем подсеть имеет NumDownsamplingBlocks блоки понижающей дискретизации, которые понижают данные и NumResidualBlocks– NumSharedBlocks остаточные блоки.
Подсеть целевого энкодера, называемая 'encoderTargetBlock', имеет начальный блок слоев, который принимает данные в целевой области, _XS. Затем подсеть имеет NumDownsamplingBlocks блоки понижающей дискретизации, которые понижают дискретизацию данных и NumResidualBlocks– NumSharedBlocks остаточные блоки.
Выходы исходного энкодера и целевого энкодера объединяются в concatenationLayer (Deep Learning Toolbox)
Общая подсеть остаточного энкодера, называемая 'encoderSharedBlock', принимает конкатенированные данные и имеет NumSharedBlocks остаточные блоки.

Модуль декодера состоит из трех подсетей, которые выполняют в общей сложности NumDownsamplingBlocks операции увеличения дискретизации данных.

Общая подсеть остаточного декодера, называемая 'decoderSharedBlock', принимает данные от энкодера и имеет NumSharedBlocks остаточные блоки.
Подсеть исходного декодера, называемая 'decoderSourceBlock', имеет NumResidualBlocks– NumSharedBlocks остаточные блоки, NumDownsamplingBlocks блоки понижающей дискретизации, которые понижают данные, и конечный блок слоев, который возвращает выход. Эта подсеть возвращает два выхода в исходной области: _XTS и _XSS. Выходным _XTS является изображение, переведенное из целевой области в исходную область. Выходной _XSS является самовосстановленным изображением из исходной области в исходную область.
Подсеть целевого декодера, называемая 'decoderTargetBlock', имеет NumResidualBlocks– NumSharedBlocks остаточные блоки, NumDownsamplingBlocks блоки понижающей дискретизации, которые понижают данные, и конечный блок слоев, который возвращает выход. Эта подсеть возвращает два выхода в целевой области: _XST и _XTT. Выходным _XTS является изображение, переведенное из исходной области в целевую область. Выходной _XTT является самовосстановленным изображением из целевой области в целевую область.

Таблица описывает блоки слоев, которые состоят из подсетей.

Тип блока	Слои	Схема блока по умолчанию
Начальный блок	Система координат `imageInputLayer` (Deep Learning Toolbox). A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks`. A `leakyReluLayer` (Deep Learning Toolbox) с масштабным коэффициентом 0,2.
Блок понижающей дискретизации	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [2 2] для выполнения понижающей дискретизации. Слой свертки имеет размер фильтра `FilterSizeInIntermediateBlocks`. Система координат `instanceNormalizationLayer` (Deep Learning Toolbox). Слой активации, заданный как `ActivationLayer` аргумент имя-значение.
Остаточный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInIntermediateBlocks`. Система координат `instanceNormalizationLayer` (Deep Learning Toolbox). Слой активации, заданный как `ActivationLayer` аргумент имя-значение. Второй `convolution2dLayer` (Deep Learning Toolbox). Второй `instanceNormalizationLayer` (Deep Learning Toolbox). Система координат `additionLayer` (Deep Learning Toolbox), который обеспечивает пропускное соединение между каждым блоком.
Блок повышающей дискретизации	Слой повышающей дискретизации, который повышается в 2 раза согласно `UpsampleMethod` аргумент имя-значение. Слой свертки имеет размер фильтра `FilterSizeInIntermediateBlocks`. Система координат `instanceNormalizationLayer` (Deep Learning Toolbox). Слой активации, заданный как `ActivationLayer` аргумент имя-значение.
Конечный блок	A `convolution2dLayer` (Deep Learning Toolbox) с шагом [1 1] и размером фильтра `FilterSizeInFirstAndLastBlocks`. Необязательный слой активации, заданный `SourceFinalActivationLayer` и `TargetFinalActivationLayer` аргументы имя-значение.

Совет

Вы можете создать сеть дискриминатора для МОДУЛЬ при помощи patchGANDiscriminator функция.
Обучите сеть UNIT GAN с помощью пользовательского цикла обучения.
Чтобы выполнить область исходного изображения в целевое и наоборот, используйте unitPredict функция.
Для кодировки общих скрытых функций аргументы 'NumSharedBlocks'и' NumResidualBlocks'должно быть больше 0.

Ссылки

[1] Лю, Мин-Ю, Томас Бреуэль и Ян Каутц. «Неконтролируемые сети перевода изображений в изображения». Усовершенствования в системах нейронной обработки информации 30 (NIPS 2017). Лонг Бич, Калифорния: 2017. https://arxiv.org/abs/1703.00848.

См. также

cycleGANGenerator | patchGANDiscriminator | pix2pixHDGlobalGenerator | unitPredict

Документация

unitGenerator

Синтаксис

Описание

Примеры

Создайте генератор UNIT

Создайте генератор UNIT с пятью остаточными блоками

Входные параметры

`inputSizeSource` - Входной размер исходного изображения
3-элементный вектор положительных целых чисел

Аргументы в виде пар имя-значение

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`2` (по умолчанию) | положительное целое число

`'NumResidualBlocks'` - Количество остаточных блоков
`5` (по умолчанию) | положительное целое число

`'NumSharedBlocks'` - Количество общих остаточных блоков
`2` (по умолчанию) | положительное целое число

`'NumTargetChannels'` - Количество каналов в целевом изображении
положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"he"` (по умолчанию) | `"glorot"` | `"narrow-normal"` | функции

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

`'SourceFinalActivationLayer'` - Функция активации после окончательной свертки в исходном декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

`'TargetFinalActivationLayer'` - Функция активации после окончательной свертки в целевом декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

Выходные аргументы

`net` - БЛОЧНАЯ генераторная сеть
`dlnetwork` объект

Подробнее о

Сеть генератора UNIT

Совет

Ссылки

См. также

Темы

Документация по Image Processing Toolbox

Поддержка

Документация

unitGenerator

Синтаксис

Описание

Примеры

Создайте генератор UNIT

Создайте генератор UNIT с пятью остаточными блоками

Входные параметры

inputSizeSource - Входной размер исходного изображения 3-элементный вектор положительных целых чисел

Аргументы в виде пар имя-значение

'NumDownsamplingBlocks' - Количество блоков понижающей дискретизации 2 (по умолчанию) | положительное целое число

'NumResidualBlocks' - Количество остаточных блоков 5 (по умолчанию) | положительное целое число

'NumSharedBlocks' - Количество общих остаточных блоков 2 (по умолчанию) | положительное целое число

'NumTargetChannels' - Количество каналов в целевом изображении положительное целое число

'NumFiltersInFirstBlock' - Количество фильтров в первом слое свертки 64 (по умолчанию) | положительное четное целое число

'ConvolutionPaddingValue' - Стиль заполнения "symmetric-exclude-edge" (по умолчанию) | "symmetric-include-edge" | "replicate" | числовой скаляр

'UpsampleMethod' - Метод, используемый для повышения активации "transposedConv" (по умолчанию) | "bilinearResize" | "pixelShuffle"

'ConvolutionWeightsInitializer' - Массовая инициализация, используемая в слоях "he" (по умолчанию) | "glorot" | "narrow-normal" | функции

'ActivationLayer' - Функция активации "relu" (по умолчанию) | "leakyRelu" | "elu" | объекта слоя

'SourceFinalActivationLayer' - Функция активации после окончательной свертки в исходном декодере "tanh" (по умолчанию) | "sigmoid" | "softmax" | "none" | объекта слоя

'TargetFinalActivationLayer' - Функция активации после окончательной свертки в целевом декодере "tanh" (по умолчанию) | "sigmoid" | "softmax" | "none" | объекта слоя

Выходные аргументы

net - БЛОЧНАЯ генераторная сеть dlnetwork объект

Подробнее о

Сеть генератора UNIT

Совет

Ссылки

См. также

Темы

Документация по Image Processing Toolbox

Поддержка

`inputSizeSource` - Входной размер исходного изображения
3-элементный вектор положительных целых чисел

`'NumDownsamplingBlocks'` - Количество блоков понижающей дискретизации
`2` (по умолчанию) | положительное целое число

`'NumResidualBlocks'` - Количество остаточных блоков
`5` (по умолчанию) | положительное целое число

`'NumSharedBlocks'` - Количество общих остаточных блоков
`2` (по умолчанию) | положительное целое число

`'NumTargetChannels'` - Количество каналов в целевом изображении
положительное целое число

`'NumFiltersInFirstBlock'` - Количество фильтров в первом слое свертки
`64` (по умолчанию) | положительное четное целое число

`'ConvolutionPaddingValue'` - Стиль заполнения
`"symmetric-exclude-edge"` (по умолчанию) | `"symmetric-include-edge"` | `"replicate"` | числовой скаляр

`'UpsampleMethod'` - Метод, используемый для повышения активации
`"transposedConv"` (по умолчанию) | `"bilinearResize"` | `"pixelShuffle"`

`'ConvolutionWeightsInitializer'` - Массовая инициализация, используемая в слоях
`"he"` (по умолчанию) | `"glorot"` | `"narrow-normal"` | функции

`'ActivationLayer'` - Функция активации
`"relu"` (по умолчанию) | `"leakyRelu"` | `"elu"` | объекта слоя

`'SourceFinalActivationLayer'` - Функция активации после окончательной свертки в исходном декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

`'TargetFinalActivationLayer'` - Функция активации после окончательной свертки в целевом декодере
`"tanh"` (по умолчанию) | `"sigmoid"` | `"softmax"` | `"none"` | объекта слоя

`net` - БЛОЧНАЯ генераторная сеть
`dlnetwork` объект