Поддерживаемые сети, слои и классы

Поддерживаемые предварительно обученные сети

GPU Coder™ поддерживает генерацию кода для сверточных нейронных сетей серии и направленного ациклического графа (DAG) (CNN или ConvNets). Можно создать код для любой обученной сверточной нейронной сети, уровни которой поддерживаются для генерации кода. См. раздел Поддерживаемые слои. Можно обучить сверточную нейронную сеть либо на CPU, либо на GPU, либо на нескольких GPU с помощью Toolbox™ Deep Learning, либо использовать одну из предварительно подготовленных сетей, перечисленных в таблице, и создать код CUDA ®.

Сетевое имя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM ® для графического процессора Мали
AlexNet	Сверточная нейронная сеть AlexNet. Для получения информации о предварительно подготовленной модели AlexNet см. `alexnet` (инструментарий глубокого обучения). Синтаксис `alexnet('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
Сеть Caffe	Сверточные модели нейронных сетей от Caffe. Для получения информации об импорте предварительно обученной сети из Caffe см. `importCaffeNetwork` (инструментарий глубокого обучения).	Да	Да	Да
Darknet-19	Darknet-19 сверточная нейронная сеть. Дополнительные сведения см. в разделе `darknet19` (инструментарий глубокого обучения). Синтаксис `darknet19('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
Darknet-53	Darknet-53 сверточная нейронная сеть. для получения дополнительной информации см. `darknet53` (инструментарий глубокого обучения). Синтаксис `darknet53('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
DeepLab v3 +	Сверточная нейронная сеть DeepLab v3 +. Дополнительные сведения см. в разделе`deeplabv3plusLayers`(Панель инструментов компьютерного зрения).	Да	Да	Нет
DenseNet-201	DenseNet-201 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели DenseNet-201 см. `densenet201` (инструментарий глубокого обучения). Синтаксис `densenet201('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
EfficientNet-b0	EfficientNet-b0 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели EfficientNet-b0 см. `efficientnetb0` (инструментарий глубокого обучения). Синтаксис `efficientnetb0('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
GoogLeNet	Сверточная нейронная сеть GoogLeNet. Для получения информации о предварительно подготовленной модели GoogLeNet см. `googlenet` (инструментарий глубокого обучения). Синтаксис `googlenet('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
Inception-ResNet-v2	Inception-ResNet-v2 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели Inception-ResNet-v2 см. `inceptionresnetv2` (инструментарий глубокого обучения).	Да	Да	Нет
Inception-v3	Inception-v3 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели Inception-v3 см. `inceptionv3` (инструментарий глубокого обучения). Синтаксис `inceptionv3('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
Mobilenet-v2	MobileNet-v2 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели MobileNet-v2 см. `mobilenetv2` (инструментарий глубокого обучения). Синтаксис `mobilenetv2('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
NASNet - Большой	NASNet - Крупная сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели NASNet-Large см. `nasnetlarge` (инструментарий глубокого обучения).	Да	Да	Нет
NASNet-Mobile	Сверточная нейронная сеть NASNet-Mobile. Для получения информации о предварительно подготовленной модели NASNet-Mobile см. `nasnetmobile` (инструментарий глубокого обучения).	Да	Да	Нет
ResNet	ResNet-18, ResNet-50 и ResNet-101 сверточные нейронные сети. Для получения информации о предварительно подготовленных моделях ResNet см. `resnet50` (инструментарий глубокого обучения), `resnet18` (инструментарий глубокого обучения), и `resnet101` (инструментарий глубокого обучения). Синтаксис `resnetXX('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
SegNet	Многоклассная пиксельная сегментационная сеть. Дополнительные сведения см. в разделе `segnetLayers`(Панель инструментов компьютерного зрения).	Да	Да	Нет
SqueezeNet	Небольшая глубокая нейронная сеть. Для получения информации о предварительно подготовленных моделях SqueeeNet см. `squeezenet` (инструментарий глубокого обучения). Синтаксис `squeezenet('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
VGG-16	VGG-16 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели VGG-16 см. `vgg16` (инструментарий глубокого обучения). Синтаксис `vgg16('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
VGG-19	VGG-19 сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели VGG-19 см. `vgg19` (инструментарий глубокого обучения). Синтаксис `vgg19('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
Xception	Xception сверточная нейронная сеть. Для получения информации о предварительно подготовленной модели Xception см. `xception` (инструментарий глубокого обучения). Синтаксис `xception('Weights','none')` не поддерживается для создания кода.	Да	Да	Да
YOLO v2	Вы ищете только один сверточный детектор объектов на основе нейронной сети версии 2. Дополнительные сведения см. в разделе `yolov2Layers`(Панель инструментов компьютерного зрения)	Да	Да	Да

Поддерживаемые слои

Следующие уровни поддерживаются для генерации кода кодером графического процессора для целевых библиотек глубокого обучения, указанных в таблице.

Входные слои

Имя слоя Описание cuDNN TensorRT Вычислительная библиотека ARM для графического процессора Мали

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`imageInputLayer` (инструментарий для глубокого обучения)	Уровень ввода изображения вводит 2-D изображения в сеть и применяет нормализацию данных. Создание кода не поддерживает `'Normalization'` задается с помощью дескриптора функции.	Да	Да	Да
`sequenceInputLayer` (инструментарий для глубокого обучения)	Входной уровень последовательности вводит данные последовательности в сеть. Библиотека cuDNN поддерживает векторные и 2-D последовательности изображений. Библиотека TensorRT поддерживает только векторные входные последовательности. Для входов векторной последовательности число элементов должно быть константой во время генерации кода. Для входных данных последовательности изображений высота, ширина и количество каналов должны быть постоянными во время генерации кода. Создание кода не поддерживает `'Normalization'` задается с помощью дескриптора функции.	Да	Да	Нет
`featureInputLayer` (инструментарий для глубокого обучения)	Входной уровень элемента вводит данные элемента в сеть и применяет нормализацию данных.	Да	Да	Да

imageInputLayer (инструментарий для глубокого обучения)

Уровень ввода изображения вводит 2-D изображения в сеть и применяет нормализацию данных.

Создание кода не поддерживает 'Normalization' задается с помощью дескриптора функции.

Да

sequenceInputLayer (инструментарий для глубокого обучения)

Входной уровень последовательности вводит данные последовательности в сеть.

Библиотека cuDNN поддерживает векторные и 2-D последовательности изображений. Библиотека TensorRT поддерживает только векторные входные последовательности.

Для входов векторной последовательности число элементов должно быть константой во время генерации кода.

Для входных данных последовательности изображений высота, ширина и количество каналов должны быть постоянными во время генерации кода.

Создание кода не поддерживает 'Normalization' задается с помощью дескриптора функции.

Да

Нет

featureInputLayer (инструментарий для глубокого обучения)

Входной уровень элемента вводит данные элемента в сеть и применяет нормализацию данных.

Да

Свертка и полностью соединенные слои

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`convolution2dLayer` (инструментарий для глубокого обучения)	2-D сверточный слой применяет скользящие сверточные фильтры к входу.	Да	Да	Да
`fullyConnectedLayer` (инструментарий для глубокого обучения)	Полностью связанный слой умножает входной сигнал на весовую матрицу и затем добавляет вектор смещения.	Да	Да	Нет
`groupedConvolution2dLayer` (инструментарий для глубокого обучения)	2-D сгруппированный сверточный слой разделяет входные каналы на группы и применяет скользящие сверточные фильтры. Используйте сгруппированные сверточные слои для разделяемых по каналам (также называемых разделяемыми по глубине) сверток. Генерация кода для графического процессора ARM Mali не поддерживается для 2-D сгруппированного слоя свертки, который имеет `NumGroups` свойство установлено как `'channel-wise'` или значение больше двух.	Да	Да	Да
`transposedConv2dLayer` (инструментарий для глубокого обучения)	Транспонированный слой свертки 2-D увеличивает выборку карт элементов.	Да	Да	Да

Последовательность слоев

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`bilstmLayer` (инструментарий для глубокого обучения)	Уровень двунаправленного LSTM (BiLSTM) изучает двунаправленные долгосрочные зависимости между временными шагами временных рядов или данных последовательности. Эти зависимости могут быть полезны, если необходимо, чтобы сеть извлекала уроки из полного временного ряда на каждом временном шаге. Для создания кода, `StateActivationFunction` свойство должно иметь значение `'tanh'`. Для создания кода, `GateActivationFunction` свойство должно иметь значение `'sigmoid'`.	Да	Да	Нет
`flattenLayer` (инструментарий для глубокого обучения)	Плоский слой сворачивает пространственные размеры входа в размер канала.	Да	Нет	Нет
`gruLayer` (инструментарий для глубокого обучения)	Уровень GRU распознает зависимости между временными шагами во временных рядах и данными последовательности. Генерация кода поддерживает только `'after-multiplication'` и `'recurrent-bias-after-multiplication'` сбросить режимы затвора.	Да	Да	Нет
`lstmLayer` (инструментарий для глубокого обучения)	Уровень LSTM распознает долгосрочные зависимости между временными шагами во временных рядах и данными последовательности. Для создания кода, `StateActivationFunction` свойство должно иметь значение `'tanh'`. Для создания кода, `GateActivationFunction` свойство должно иметь значение `'sigmoid'`.	Да	Да	Нет
`sequenceFoldingLayer` (инструментарий для глубокого обучения)	Слой складывания последовательности преобразует пакет последовательностей изображений в пакет изображений. Используйте слой сворачивания последовательности для выполнения операций свертки на временных шагах последовательностей изображений независимо.	Да	Нет	Нет
`sequenceInputLayer` (инструментарий для глубокого обучения)	Входной уровень последовательности вводит данные последовательности в сеть. Библиотека cuDNN поддерживает векторные и 2-D последовательности изображений. Библиотека TensorRT поддерживает только векторные входные последовательности. Для входов векторной последовательности число элементов должно быть константой во время генерации кода. Для входных данных последовательности изображений высота, ширина и количество каналов должны быть постоянными во время генерации кода. Создание кода не поддерживает `'Normalization'` задается с помощью дескриптора функции.	Да	Да	Нет
`sequenceUnfoldingLayer` (инструментарий для глубокого обучения)	Слой развертки последовательности восстанавливает структуру последовательности входных данных после свертывания последовательности.	Да	Нет	Нет
`wordEmbeddingLayer`(Панель инструментов для анализа текста)	Слой встраивания слов отображает индексы слов в векторы.	Да	Да	Нет

Уровни активации

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`clippedReluLayer` (инструментарий для глубокого обучения)	Подрезанный слой ReLU выполняет пороговую операцию, при которой любое входное значение меньше нуля устанавливается равным нулю, а любое значение выше подрезанного потолка устанавливается на этот подрезанный потолок.	Да	Да	Да
`eluLayer` (инструментарий для глубокого обучения)	Уровень активации ЗЭС выполняет операцию идентификации на положительных входах и экспоненциальную нелинейность на отрицательных входах.	Да	Да	Нет
`leakyReluLayer` (инструментарий для глубокого обучения)	Уровень ReLU с утечкой выполняет пороговую операцию, где любое входное значение, меньшее нуля, умножается на фиксированный скаляр.	Да	Да	Да
`reluLayer` (инструментарий для глубокого обучения)	Уровень ReLU выполняет пороговую операцию для каждого элемента входа, где любое значение меньше нуля устанавливается равным нулю.	Да	Да	Да
`softplusLayer`(инструментарий для обучения по усилению)	A `SoftplusLayer` - глубокий нейронный сетевой уровень, реализующий активацию софтплуса Y = log (1 + ^eX), что гарантирует, что выход всегда положительный.	Да	Да	Нет
`tanhLayer` (инструментарий для глубокого обучения)	Слой активации гиперболической касательной (tanh) применяет функцию tanh на входах слоя.	Да	Да	Да

Нормализация, отсев и обрезка слоев

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`batchNormalizationLayer` (инструментарий для глубокого обучения)	Уровень нормализации пакета нормализует каждый входной канал в мини-пакете.	Да	Да	Да
`crop2dLayer` (инструментарий для глубокого обучения)	Слой подрезки 2-D применяется 2-D обрезки к вводу.	Да	Да	Да
`crossChannelNormalizationLayer` (инструментарий для глубокого обучения)	Канальный уровень локальной (кросс-канальной) нормализации выполняет канальную нормализацию.	Да	Да	Да
`dropoutLayer` (инструментарий для глубокого обучения)	Уровень отсева случайным образом устанавливает входные элементы в ноль с заданной вероятностью.	Да	Да	Да
`scalingLayer`(инструментарий для обучения по усилению)	Уровень масштабирования для сети актеров или критиков. Для генерации кода значения для `'Scale'` и `'Bias'` свойства должны иметь одинаковый размер.	Да	Да	Да

Объединение в пулы и удаление из пула слоев

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`averagePooling2dLayer` (инструментарий для глубокого обучения)	Средний уровень объединения выполняет понижающую выборку путем разделения входных данных на прямоугольные области объединения и вычисления средних значений каждой области.	Да	Да	Да
`globalAveragePooling2dLayer` (инструментарий для глубокого обучения)	Уровень глобального среднего объединения выполняет понижающую выборку путем вычисления среднего значения высоты и ширины входного сигнала.	Да	Да	Да
`globalMaxPooling2dLayer` (инструментарий для глубокого обучения)	Глобальный уровень максимального объединения выполняет понижающую выборку путем вычисления максимума высоты и ширины входного сигнала.	Да	Да	Да
`maxPooling2dLayer` (инструментарий для глубокого обучения)	Максимальный уровень объединения выполняет понижающую выборку путем разделения входных данных на прямоугольные области объединения и вычисления максимума каждой области.	Да	Да	Да
`maxUnpooling2dLayer` (инструментарий для глубокого обучения)	Уровень макс. расхолаживания распаковывает выходные данные уровня макс. пула.	Да	Да	Нет

Комбинированные слои

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`additionLayer` (инструментарий для глубокого обучения)	Уровень сложения добавляет входные данные от нескольких уровней нейронной сети по элементам.	Да	Да	Да
`concatenationLayer` (инструментарий для глубокого обучения)	Слой конкатенации принимает входные данные и выполняет их конкатенацию вдоль заданного размера.	Да	Да	Нет
`depthConcatenationLayer` (инструментарий для глубокого обучения)	Слой конкатенации глубины принимает входные данные одинаковой высоты и ширины и объединяет их вдоль третьего размера (размера канала).	Да	Да	Да

Слои обнаружения объектов

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`anchorBoxLayer`(Панель инструментов компьютерного зрения)	Слой поля привязки хранит поля привязки для карты элементов, используемой в сетях обнаружения объектов.	Да	Да	Да
`focalLossLayer`(Панель инструментов компьютерного зрения)	Уровень фокальных потерь предсказывает классы объектов с использованием фокальных потерь.	Да	Да	Да
`spaceToDepthLayer`(Панель инструментов обработки изображений)	Слой «пробел-глубина» преобразует пространственные блоки ввода в размер глубины. Этот слой используется в тех случаях, когда необходимо объединить карты элементов разного размера без отбрасывания каких-либо данных элементов.	Да	Да	Да
`ssdMergeLayer`(Панель инструментов компьютерного зрения)	Уровень объединения SSD объединяет выходные данные карт элементов для последующей регрессии и вычисления потерь классификации.	Да	Да	Нет
`rcnnBoxRegressionLayer`(Панель инструментов компьютерного зрения)	Слой регрессии параллелепипеда позволяет уточнить расположение ограничивающего параллелепипеда с помощью функции сглаживания потерь L1. Этот уровень используется для создания сети обнаружения объектов Fast или Faster R-CNN.	Да	Да	Да
`rpnClassificationLayer`(Панель инструментов компьютерного зрения)	Слой классификации сети предложений области (RPN) классифицирует области изображения как объект или фон с помощью функции перекрестных потерь энтропии. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN.	Да	Да	Да
`YOLOv2OutputLayer`(Панель инструментов компьютерного зрения)	Создание выходного уровня для сети обнаружения объектов YOLO v2.	Да	Да	Да
`YOLOv2ReorgLayer`(Панель инструментов компьютерного зрения)	Создание уровня реорганизации для сети обнаружения объектов YOLO v2.	Да	Да	Да
`YOLOv2TransformLayer`(Панель инструментов компьютерного зрения)	Создание слоя преобразования для сети обнаружения объектов YOLO v2.	Да	Да	Да

Выходные слои

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`classificationLayer` (инструментарий для глубокого обучения)	Уровень классификации вычисляет потери перекрестной энтропии для проблем классификации нескольких классов с взаимоисключающими классами.	Да	Да	Да
`dicePixelClassificationLayer`(Панель инструментов компьютерного зрения)	Слой классификации пикселей Dice предоставляет категориальную метку для каждого пикселя изображения или вокселя с использованием обобщенной потери Dice.	Да	Да	Да
`focalLossLayer`(Панель инструментов компьютерного зрения)	Уровень фокальных потерь предсказывает классы объектов с использованием фокальных потерь.	Да	Да	Да
`Output Layer` (инструментарий для глубокого обучения)	Все выходные слои, включая пользовательские слои классификации или регрессии, созданные с помощью `nnet.layer.ClassificationLayer` или `nnet.layer.RegressionLayer`. Пример определения пользовательского выходного слоя классификации и функции потери см. в разделе Определение пользовательского выходного слоя классификации (панель инструментов глубокого обучения). Пример определения пользовательского выходного слоя регрессии и определения функции потери см. в разделе Определение пользовательского выходного слоя регрессии (панель инструментов глубокого обучения).	Да	Да	Да
`pixelClassificationLayer`(Панель инструментов компьютерного зрения)	Слой классификации пикселей обеспечивает категориальную метку для каждого пикселя изображения или вокселя.	Да	Да	Да
`rcnnBoxRegressionLayer`(Панель инструментов компьютерного зрения)	Слой регрессии параллелепипеда позволяет уточнить расположение ограничивающего параллелепипеда с помощью функции сглаживания потерь L1. Этот уровень используется для создания сети обнаружения объектов Fast или Faster R-CNN.	Да	Да	Да
`regressionLayer` (инструментарий для глубокого обучения)	Регрессионный уровень вычисляет среднеквадратичную потерю ошибок для регрессионных задач.	Да	Да	Да
`rpnClassificationLayer`(Панель инструментов компьютерного зрения)	Слой классификации сети предложений области (RPN) классифицирует области изображения как объект или фон с помощью функции перекрестных потерь энтропии. Этот уровень используется для создания более быстрой сети обнаружения объектов R-CNN.	Да	Да	Да
`sigmoidLayer` (инструментарий для глубокого обучения)	Сигмоидальный слой применяет к входу сигмоидальную функцию.	Да	Да	Да
`softmaxLayer` (инструментарий для глубокого обучения)	Уровень softmax применяет функцию softmax к входу.	Да	Да	Да

Уровни Keras и ONNX

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`nnet.keras.layer.FlattenCStyleLayer` (инструментарий для глубокого обучения)	Распрямить активации в 1-D, предполагая порядок C-style (строка-мажор).	Да	Да	Да
`nnet.keras.layer.GlobalAveragePooling2dLayer` (инструментарий для глубокого обучения)	Уровень глобального среднего объединения пространственных данных.	Да	Да	Да
`nnet.keras.layer.SigmoidLayer` (инструментарий для глубокого обучения)	Слой активации сигмоида.	Да	Да	Да
`nnet.keras.layer.TanhLayer` (инструментарий для глубокого обучения)	Слой активации гиперболических касательных.	Да	Да	Да
`nnet.keras.layer.ZeroPadding2dLayer` (инструментарий для глубокого обучения)	Нулевой слой заполнения для ввода 2-D.	Да	Да	Да
`nnet.onnx.layer.ElementwiseAffineLayer` (инструментарий для глубокого обучения)	Слой, выполняющий масштабирование входных данных по элементам с последующим добавлением.	Да	Да	Да
`nnet.onnx.layer.FlattenLayer` (инструментарий для глубокого обучения)	Выравнивает пространственные размеры входного тензора по размерам канала.	Да	Да	Да
`nnet.onnx.layer.IdentityLayer` (инструментарий для глубокого обучения)	Уровень, реализующий оператор идентификации ONNX.	Да	Да	Да

Пользовательские слои

Имя слоя Описание cuDNN TensorRT Вычислительная библиотека ARM для графического процессора Мали

Имя слоя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`Custom layers`	Пользовательские слои с обучаемыми параметрами или без них, определяемые для данной проблемы. Сведения об определении пользовательских слоев глубокого обучения см. в разделах Определение пользовательских слоев глубокого обучения (панель инструментов глубокого обучения) и Определение пользовательских слоев глубокого обучения для создания кода (панель инструментов глубокого обучения). Пример создания кода для сети с пользовательскими слоями см. в разделе Создание кода для обнаружения объектов с помощью глубокого обучения YOLO v3. Выходами пользовательского слоя должны быть массивы фиксированного размера. Используя `'unified'` в качестве `MallocMode` в `coder.gpuConfig` требует дополнительных копий памяти, что приводит к снижению производительности. Для пользовательских слоев рекомендуется использовать `'discrete'` режим. Дополнительные сведения о выделении памяти GPU см. в разделе Дискретные и управляемые режимы Цели cuDNN поддерживают генерацию кода типа «строка-большая» и «столбец-большая» для пользовательских уровней. Цели TensorRT поддерживают только генерацию основного кода столбца. Для создания кода пользовательские слои должны содержать `%#codegen` прагматика. Создание кода для сети последовательностей, содержащей пользовательский уровень и уровень LSTM или GRU, не поддерживается. Создание кода для сети глубокого обучения с пользовательским уровнем не поддерживается в Simulink ®.	Да	Да	Нет

Custom layers

Пользовательские слои с обучаемыми параметрами или без них, определяемые для данной проблемы.

Сведения об определении пользовательских слоев глубокого обучения см. в разделах Определение пользовательских слоев глубокого обучения (панель инструментов глубокого обучения) и Определение пользовательских слоев глубокого обучения для создания кода (панель инструментов глубокого обучения).

Пример создания кода для сети с пользовательскими слоями см. в разделе Создание кода для обнаружения объектов с помощью глубокого обучения YOLO v3.

Выходами пользовательского слоя должны быть массивы фиксированного размера.

Используя 'unified' в качестве MallocMode в coder.gpuConfig требует дополнительных копий памяти, что приводит к снижению производительности. Для пользовательских слоев рекомендуется использовать 'discrete' режим. Дополнительные сведения о выделении памяти GPU см. в разделе Дискретные и управляемые режимы

Цели cuDNN поддерживают генерацию кода типа «строка-большая» и «столбец-большая» для пользовательских уровней. Цели TensorRT поддерживают только генерацию основного кода столбца.

Для создания кода пользовательские слои должны содержать %#codegen прагматика.

Создание кода для сети последовательностей, содержащей пользовательский уровень и уровень LSTM или GRU, не поддерживается.

Создание кода для сети глубокого обучения с пользовательским уровнем не поддерживается в Simulink ®.

Да

Нет

Поддерживаемые классы

Следующие классы поддерживаются для генерации кода кодером графического процессора для целевых библиотек глубокого обучения, указанных в таблице.

Имя	Описание	cuDNN	TensorRT	Вычислительная библиотека ARM для графического процессора Мали
`DAGNetwork` (инструментарий для глубокого обучения)	Сеть направленных ациклических графов (DAG) для глубокого обучения Только `activations`, `predict`, и `classify` поддерживаются методы.	Да	Да	Да
`dlnetwork` (инструментарий для глубокого обучения)	Сеть глубокого обучения для пользовательских циклов обучения Генерация кода поддерживает только `InputNames` и `OutputNames` свойства. Создание кода не поддерживает `dlnetwork` объекты без входных слоев. Создание кода для `dlnetwork` объекты с `sequenceInputLayer` объекты не поддерживаются. Генерация кода поддерживает только `predict` объектная функция. `dlarray` входные данные для `predict` метод должен быть `single` тип данных.	Да	Да	Нет
`SeriesNetwork` (инструментарий для глубокого обучения)	Сеть серии для глубокого обучения Только `activations`, `classify`, `predict`, `predictAndUpdateState`, `classifyAndUpdateState`, и `resetState` поддерживаются функции объекта.	Да	Да	Да
`ssdObjectDetector`(Панель инструментов компьютерного зрения)	Объект для обнаружения объектов с помощью SSD-детектора. Только `detect` (Computer Vision Toolbox) метод `ssdObjectDetector` поддерживается для создания кода. `roi` аргумент для `detect` метод должен быть константой кодегена (`coder.const()`) и вектор 1x4. Только `Threshold`, `SelectStrongest`, `MinSize`, `MaxSize`, и `MiniBatchSize` Поддерживаются пары имя-значение. Все пары Имя (Name) - Значение (Value) должны быть константами времени компиляции. Размер канала и пакета входного изображения должен быть фиксированным. `labels` возвращается в виде категориального массива. В сгенерированном коде входные данные масштабируются до размера входного уровня сети. Но ограничивающая рамка, которая `detect` возвращает в привязке к исходному размеру ввода. Ограничивающие рамки могут не соответствовать числовым результатам моделирования.	Да	Да	Нет
`yolov2ObjectDetector`(Панель инструментов компьютерного зрения)	Обнаружение объектов с помощью детектора объектов YOLO v2 Только `detect` (Computer Vision Toolbox) метод `yolov2ObjectDetector` поддерживается для создания кода. `roi` аргумент для `detect` метод должен быть константой кодегена (`coder.const()`) и вектор 1x4. Только `Threshold`, `SelectStrongest`, `MinSize`, `MaxSize`, и `MiniBatchSize` Поддерживаются пары имя-значение. Высота, ширина, канал и размер партии входного изображения должны быть фиксированными. Минимальное значение размера пакета, переданного методу обнаружения, должно быть фиксированным. Выходные данные меток возвращаются в виде массива ячеек символьных векторов, таких как {'car', 'bus'}.	Да	Да	Да

См. также

Функции

codegen | coder.DeepLearningConfig | coder.getDeepLearningLayers

Объекты

coder.CodeConfig | coder.CuDNNConfig | coder.EmbeddedCodeConfig | coder.gpuConfig | coder.gpuEnvConfig | coder.TensorRTConfig

Связанные темы

Предварительно обученные нейронные сети (набор инструментов для глубокого обучения)
Начало работы с обучающей программой Transfer (инструментарий для глубокого обучения)
Создание простой сети глубокого обучения для классификации (инструментарий для глубокого обучения)
Загрузка предварительно подготовленных сетей для генерации кода
Создание кода для сетей глубокого обучения с помощью cuDNN
Создание кода для сетей глубокого обучения с помощью TensorRT
Создание кода для сетей глубокого обучения, предназначенных для графических процессоров ARM Mali

Документация