exponenta event banner

fcnLayers

Создание полностью сверточных сетевых уровней для семантической сегментации

Описание

пример

lgraph = fcnLayers(imageSize,numClasses) возвращает полностью сверточную сеть (FCN), сконфигурированную как FCN 8s, для семантической сегментации. FCN предварительно инициализируется с использованием уровней и весов из VGG-16 сети.

fcnLayers включает pixelClassificationLayer для прогнозирования категориальной метки для каждого пикселя во входном изображении. Слой классификации пикселей поддерживает только изображения RGB.

Для этой функции требуется модель Deep Learning Toolbox™ для пакета поддержки VGG-16 Network. Если этот пакет поддержки не установлен, то vgg16 Функция (Deep Learning Toolbox) предоставляет ссылку для загрузки.

lgraph = fcnLayers(imageSize,numClasses,'Type',type) возвращает FCN, сконфигурированный как тип, указанный type.

Примеры

свернуть все

Определите размер изображения и количество классов, а затем создайте сеть.

imageSize = [480 640];
numClasses = 5;
lgraph = fcnLayers(imageSize,numClasses)

Отображение сети.

plot(lgraph)

Создайте FCN 16.

imageSize = [480 640];
numClasses = 5;
lgraph = fcnLayers(imageSize,numClasses,'Type','16s')

Отображение сети.

plot(lgraph)

Входные аргументы

свернуть все

Размер сетевого входного изображения, заданного как двухэлементный вектор в формате [высота, ширина]. Минимальный размер изображения равен [224 224], поскольку FCN основан на сети VGG-16.

Число классов в семантической сегментации, указанное как целое число больше 1.

Тип модели FCN, указанный как одно из следующих значений:

Модель FCNОписание
'32s'

Увеличивает выборку конечной карты элементов в 32 раза. Эта опция обеспечивает грубую сегментацию с меньшими вычислительными затратами.

'16s'

Увеличивает выборку конечной карты элементов в 16 раз после слияния карты элементов с четвертым уровнем объединения. Эта дополнительная информация более ранних уровней обеспечивает сегментацию среднего зерна за счет дополнительных вычислений.

'8s'

Увеличивает выборку конечной карты элементов в 8 раз после слияния карт элементов из третьего и четвертого уровней максимального объединения. Эта дополнительная информация из более ранних уровней обеспечивает более мелкозернистую сегментацию за счет дополнительных вычислений.

Выходные аргументы

свернуть все

Уровни, представляющие сетевую архитектуру FCN, возвращаемые как layerGraph(Панель инструментов глубокого обучения).

Все транспонированные слои свертки инициализируются с использованием билинейных интерполяционных весов. Все члены смещения транспонированного слоя свертки зафиксированы в нуле.

Совет

  • Сети, созданные fcnLayers поддержка генерации кода GPU для глубокого обучения после обучения с помощью trainNetwork (инструментарий глубокого обучения). Подробные сведения и примеры см. в разделе Создание кода глубокого обучения (панель инструментов глубокого обучения).

Ссылки

[1] Долго, J., Э. Шелхэмер и Т. Даррелл. «Полностью сверточные сети для семантической сегментации». Материалы Конференции IEEE по компьютерному зрению и распознаванию образов, 2015 год, стр. 3431-3440.

См. также

Объекты

Функции

Представлен в R2017b