GPU Coder™ поддерживает генерацию кода для ряда и сверточных нейронных сетей направленного графа без петель (DAG) (CNNs или ConvNets). Можно сгенерировать код для любой обученной сверточной нейронной сети, слои которой поддерживаются для генерации кода. Смотрите Поддерживаемые Слои. Можно обучить сверточную нейронную сеть или на центральном процессоре, графическом процессоре или на нескольких графических процессорах при помощи Deep Learning Toolbox™ или использовать одну из перечисленных в таблице предварительно обученных сетей и сгенерировать код CUDA®.
Сетевое имя | Описание | cuDNN | TensorRT | Библиотека ARM® Compute для Мали графический процессор |
---|---|---|---|---|
AlexNet | Сверточная нейронная сеть AlexNet. Для предварительно обученной модели AlexNet смотрите | Да | Да | Да |
GoogLeNet | Сверточная нейронная сеть GoogLeNet. Для предварительно обученной модели GoogLeNet смотрите | Да | Да | Да |
Caffe Network | Модели сверточной нейронной сети от Caffe. Для импорта предварительно обученной сети от Caffe смотрите | Да | Да | Да |
DeepLab v3 + | DeepLab v3 + сверточная нейронная сеть. Для получения дополнительной информации смотрите | Да | Да | Нет |
DenseNet-201 | Сверточная нейронная сеть DenseNet-201. Для предварительно обученной модели DenseNet-201 смотрите | Да | Да | Да |
Inception-v3 | Сверточная нейронная сеть Inception-v3. Для предварительно обученной модели Inception-v3 смотрите | Да | Да | Да |
Mobilenet-v2 | Сверточная нейронная сеть MobileNet-v2. Для предварительно обученной модели MobileNet-v2 смотрите | Да | Да | Да |
ResNet | ResNet-18, ResNet-50 и сверточные нейронные сети ResNet-101. Для предварительно обученных моделей ResNet смотрите | Да | Да | Да |
SegNet | Мультикласс pixelwise сеть сегментации. Для получения дополнительной информации смотрите | Да | Да | Нет |
SqueezeNet | Маленькая глубокая нейронная сеть. Для предварительно обученных моделей SqueezeNet смотрите | Да | Да | Да |
VGG-16 | Сверточная нейронная сеть VGG-16. Для предварительно обученной модели VGG-16 смотрите | Да | Да | Да |
VGG-19 | Сверточная нейронная сеть VGG-19. Для предварительно обученной модели VGG-19 смотрите | Да | Да | Да |
Xception | Сверточная нейронная сеть Xception. Для предварительно обученной модели Xception смотрите | Да | Да | Да |
YOLO v2 | Вы только смотрите однажды версия 2 основанный на сверточной нейронной сети детектор объектов. Для получения дополнительной информации смотрите | Да | Да | Да |
Следующие слои поддерживаются для генерации кода GPU Coder для целевых библиотек глубокого обучения, заданных в таблице.
Если вы устанавливаете Интерфейс GPU Coder пакета поддержки для Библиотек Глубокого обучения, можно использовать coder.getDeepLearningLayers
видеть список слоев, поддержанных для определенной библиотеки глубокого обучения. Например, coder.getDeepLearningLayers('cudnn')
показывает список слоев, поддержанных для генерации кода при помощи библиотеки NVIDIA® cuDNN.
Имя слоя | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|
additionLayer | Слой Addition. | Да | Да | Да |
averagePooling2dLayer | Средний слой объединения. | Да | Да | Да |
batchNormalizationLayer | Пакетный слой нормализации. | Да | Да | Да |
classificationLayer | Создайте классификацию выходной слой. | Да | Да | Да |
clippedReluLayer | Отсеченный слой Rectified Linear Unit (ReLU). | Да | Да | Да |
concatenationLayer | Слой конкатенации берет входные параметры и конкатенирует их в заданном измерении. | Да | Нет | Нет |
convolution2dLayer | 2D слой свертки. | Да | Да | Да |
crop2dLayer | Слой, который применяет 2D обрезку к входу. | Да | Да | Да |
crossChannelNormalizationLayer | Мудрый каналом локальный слой нормализации ответа. | Да | Да | Да |
depthConcatenationLayer | Слой конкатенации глубины. | Да | Да | Да |
dicePixelClassificationLayer | Слой классификации пикселей с помощью обобщенной потери dice в семантической сегментации. | Да | Да | Да |
dropoutLayer | Слой Dropout. | Да | Да | Да |
eluLayer | Слой Exponential linear unit (ELU). | Да | Да | Нет |
fullyConnectedLayer | Полносвязный слой. | Да | Да | Да |
globalAveragePooling2dLayer | Глобальный средний слой объединения для пространственных данных. | Да | Да | Да |
groupedConvolution2dLayer | 2D сгруппированный сверточный слой. Генерация кода для графического процессора ARM Mali не поддержана для 2D сгруппированного слоя свертки, который имеет | Да | Да | Да |
imageInputLayer | Отобразите входной слой.
| Да | Да | Да |
leakyReluLayer | Текучий слой Rectified Linear Unit (ReLU). | Да | Да | Да |
lstmLayer | Слой Long short-term memory (LSTM).
| Да | Нет | Нет |
maxPooling2dLayer | Слой объединения Max. | Да | Да | Да |
maxUnpooling2dLayer | Слой необъединения Max. | Да | Да | Нет |
Output Layer | Все выходные слои включая пользовательскую классификацию или регрессию выводят слои, созданные при помощи Для примера, показывающего, как задать пользовательскую классификацию выходной слой и задать функцию потерь, смотрите, Задают Пользовательскую Классификацию Выходной Слой (Deep Learning Toolbox). Для примера, показывающего, как задать пользовательскую регрессию выходной слой и задать функцию потерь, смотрите, Задают Пользовательскую Регрессию Выходной Слой (Deep Learning Toolbox). | Да | Да | Да |
PixelClassificationLayer | Создайте слой классификации пикселей для семантической сегментации. | Да | Да | Да |
regressionLayer | Создайте регрессию выходной слой. | Да | Да | Да |
reluLayer | Слой Rectified Linear Unit (ReLU). | Да | Да | Да |
sequenceInputLayer | Последовательность ввела слой.
| Да | Нет | Нет |
softmaxLayer | Слой Softmax. | Да | Да | Да |
tanhLayer | Гиперболическая касательная (tanh) слой. | Да | Да | Да |
transposedConv2dLayer | Создайте транспонированный 2D слой свертки. Генерация кода не поддерживает асимметричную обрезку входа. Например, задавая векторный | Да | Да | Да |
wordEmbeddingLayer | Слой встраивания слова сопоставляет словари с векторами. | Да | Нет | Нет |
YOLOv2OutputLayer | Создайте выходной слой для сети обнаружения объектов YOLO v2. | Да | Да | Да |
YOLOv2ReorgLayer | Создайте слой перестройки для сети обнаружения объектов YOLO v2. | Да | Да | Да |
YOLOv2TransformLayer | Создайте преобразовывают слой для сети обнаружения объектов YOLO v2. | Да | Да | Да |
nnet.keras.layer.FlattenCStyleLayer | Сгладьте активации в 1D C-стиль принятия (упорядоченный по строкам) порядок. | Да | Да | Да |
nnet.keras.layer.GlobalAveragePooling2dLayer | Глобальный средний слой объединения для пространственных данных. | Да | Да | Да |
nnet.keras.layer.SigmoidLayer | Сигмоидальный слой активации. | Да | Да | Да |
nnet.keras.layer.TanhLayer | Гиперболический слой активации касательной. | Да | Да | Да |
nnet.keras.layer.ZeroPadding2dLayer | Нулевой дополнительный слой для 2D входа. | Да | Да | Да |
nnet.onnx.layer.ElementwiseAffineLayer | Слой, который выполняет поэлементное масштабирование входа, сопровождаемого сложением. | Да | Да | Нет |
nnet.onnx.layer.FlattenLayer | Сглаживает пространственные размерности входного тензора к размерностям канала. | Да | Да | Да |
nnet.onnx.layer.IdentityLayer | Слой, который реализует единичный оператор ONNX™. | Да | Да | Да |
Следующие классы поддерживаются для генерации кода GPU Coder для целевых библиотек глубокого обучения, заданных в таблице.
ClassName | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|
yolov2ObjectDetector | Обнаружьте объекты с помощью детектора объектов YOLO v2
| Да | Да | Да |