GPU Coder™ поддерживает генерацию кода для ряда и сверточных нейронных сетей направленного графа без петель (DAG) (CNNs или ConvNets). Можно сгенерировать код для любой обученной сверточной нейронной сети, слои которой поддерживаются для генерации кода. Смотрите Поддерживаемые Слои. Можно обучить сверточную нейронную сеть или на центральном процессоре, графическом процессоре или на нескольких графических процессорах при помощи Deep Learning Toolbox™ или использовать одну из перечисленных в таблице предварительно обученных сетей и сгенерировать код CUDA®.
Сетевое имя | Описание | cuDNN | TensorRT | Библиотека ARM® Compute для Мали графический процессор |
---|---|---|---|---|
AlexNet | Сверточная нейронная сеть AlexNet. Для предварительно обученной модели AlexNet смотрите Синтаксис | Да | Да | Да |
Сеть Caffe | Модели сверточной нейронной сети от Caffe. Для импорта предварительно обученной сети от Caffe смотрите | Да | Да | Да |
Даркнет 19 | Даркнет 19 сверточных нейронных сетей. Для получения дополнительной информации смотрите Синтаксис | Да | Да | Да |
Даркнет 53 | Даркнет 53 сверточных нейронных сети. для получения дополнительной информации смотрите Синтаксис | Да | Да | Да |
DeepLab v3 + | DeepLab v3 + сверточная нейронная сеть. Для получения дополнительной информации смотрите | Да | Да | Нет |
DenseNet-201 | Сверточная нейронная сеть DenseNet-201. Для предварительно обученной модели DenseNet-201 смотрите Синтаксис | Да | Да | Да |
GoogLeNet | Сверточная нейронная сеть GoogLeNet. Для предварительно обученной модели GoogLeNet смотрите Синтаксис | Да | Да | Да |
Inception-v3 | Сверточная нейронная сеть Inception-v3. Для предварительно обученной модели Inception-v3 смотрите Синтаксис | Да | Да | Да |
Inception-ResNet-v2 | Сверточная нейронная сеть Inception-ResNet-v2. Для предварительно обученной модели Inception-ResNet-v2 смотрите | Да | Да | Нет |
Mobilenet-v2 | Сверточная нейронная сеть MobileNet-v2. Для предварительно обученной модели MobileNet-v2 смотрите Синтаксис | Да | Да | Да |
NASNet-большой | NASNet-большая сверточная нейронная сеть. Для предварительно обученной NASNet-большой-модели смотрите | Да | Да | Нет |
NASNet-мобильный | NASNet-мобильная сверточная нейронная сеть. Для предварительно обученной модели NASNet-Mobile смотрите | Да | Да | Нет |
ResNet | ResNet-18, ResNet-50 и сверточные нейронные сети ResNet-101. Для предварительно обученных моделей ResNet смотрите Синтаксис | Да | Да | Да |
SegNet | Мультикласс pixelwise сеть сегментации. Для получения дополнительной информации смотрите | Да | Да | Нет |
SqueezeNet | Маленькая глубокая нейронная сеть. Для предварительно обученных моделей SqueezeNet смотрите Синтаксис | Да | Да | Да |
VGG-16 | Сверточная нейронная сеть VGG-16. Для предварительно обученной модели VGG-16 смотрите Синтаксис | Да | Да | Да |
VGG-19 | Сверточная нейронная сеть VGG-19. Для предварительно обученной модели VGG-19 смотрите Синтаксис | Да | Да | Да |
Xception | Сверточная нейронная сеть Xception. Для предварительно обученной модели Xception смотрите Синтаксис | Да | Да | Да |
YOLO v2 | Вы только смотрите однажды сверточная нейронная сеть версии 2 на основе детектора объектов. Для получения дополнительной информации смотрите | Да | Да | Да |
Следующие слои поддерживаются для генерации кода GPU Coder для целевых библиотек глубокого обучения, заданных в таблице.
Если вы устанавливаете Интерфейс GPU Coder пакета поддержки для Библиотек Глубокого обучения, можно использовать coder.getDeepLearningLayers
видеть список слоев, поддержанных для определенной библиотеки глубокого обучения. Например, coder.getDeepLearningLayers('cudnn')
показывает список слоев, поддержанных для генерации кода при помощи библиотеки NVIDIA® cuDNN.
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Изображение ввело входные параметры слоя 2D изображения к сети, и применяет нормализацию данных. Генерация кода не поддерживает | Да | Да | Да | |
Deep Learning Toolbox | Последовательность ввела входные данные о последовательности слоя к сети. Для генерации кода только поддерживаются векторные входные типы. 2D и 3-D вход последовательности изображений не поддержан. Генерация кода не поддерживает | Да | Да | Нет |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | 2D сверточный слой применяет скользящие сверточные фильтры к входу. | Да | Да | Да | |
Deep Learning Toolbox | 2D сгруппированный сверточный слой разделяет входные каналы на группы и применяет скользящие сверточные фильтры. Используйте сгруппированные сверточные слои в отделимом мудром каналом (также известный мудрыми глубиной отделимый) свертка. Генерация кода для графического процессора ARM Mali не поддержана для 2D сгруппированного слоя свертки, который имеет | Да | Да | Да | |
Deep Learning Toolbox | Транспонированный 2D слой свертки сверхдискретизировал карты функции. | Да | Да | Да | |
Deep Learning Toolbox | Полносвязный слой умножает вход на матрицу веса и затем добавляет вектор смещения. | Да | Да | Нет |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Последовательность ввела входные данные о последовательности слоя к сети. Для генерации кода только поддерживаются векторные входные типы. 2D и 3-D вход последовательности изображений не поддержан. Генерация кода не поддерживает | Да | Да | Нет | |
Deep Learning Toolbox | Слой LSTM изучает долгосрочные зависимости между временными шагами в данных о последовательности и временных рядах. Для генерации кода, Для генерации кода, | Да | Да | Нет | |
Deep Learning Toolbox | Двунаправленный слой LSTM (BiLSTM) изучает двунаправленные долгосрочные зависимости между временными шагами данных о последовательности или временных рядов. Эти зависимости могут быть полезными, когда это необходимо, сеть, чтобы извлечь уроки из полных временных рядов на каждом временном шаге. Для генерации кода, Для генерации кода, | Да | Да | Нет | |
Deep Learning Toolbox | Сглаживать слой сворачивает пространственные размерности входа в размерность канала. | Да | Нет | Нет | |
Text Analytics Toolbox™ | Слой встраивания слова сопоставляет словари с векторами. | Да | Да | Нет |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Слой ReLU выполняет пороговую операцию к каждому элементу входа, где любое значение меньше, чем нуль обнуляется. | Да | Да | Да | |
Deep Learning Toolbox | Текучий слой ReLU выполняет пороговую операцию, где любое входное значение меньше, чем нуль умножается на фиксированный скаляр. | Да | Да | Да | |
Deep Learning Toolbox | Отсеченный слой ReLU выполняет пороговую операцию, где любое входное значение, меньше, чем нуль обнуляются и любое значение выше потолка усечения, установлено в тот потолок усечения. | Да | Да | Да | |
Deep Learning Toolbox | Слой активации ELU выполняет единичную операцию на положительных входных параметрах и экспоненциальную нелинейность на отрицательных входных параметрах. | Да | Да | Нет | |
Deep Learning Toolbox | Гиперболическая касательная (tanh) слой активации применяет функцию tanh на входные параметры слоя. | Да | Да | Да |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Слой нормализации партии. нормирует каждый входной канал через мини-пакет. | Да | Да | Да | |
Deep Learning Toolbox | Мудрый каналом локальный ответ (межканальный) слой нормализации выполняет мудрую каналом нормализацию. | Да | Да | Да | |
Deep Learning Toolbox | Слой уволенного случайным образом обнуляет входные элементы с данной вероятностью. | Да | Да | Да | |
Deep Learning Toolbox | 2D слой обрезки применяет 2D обрезку к входу. | Да | Да | Да |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Средний слой объединения выполняет субдискретизацию путем деления входа на прямоугольные области объединения и вычисление средних значений каждой области. | Да | Да | Да | |
Deep Learning Toolbox | Глобальный средний слой объединения выполняет субдискретизацию путем вычисления среднего значения размерностей высоты и ширины входа. | Да | Да | Да | |
Deep Learning Toolbox | Макс. слой объединения выполняет субдискретизацию путем деления входа на прямоугольные области объединения и вычисления максимума каждой области. | Да | Да | Да | |
Deep Learning Toolbox | Глобальная переменная макс. объединение слоя выполняет субдискретизацию путем вычисления максимума размерностей высоты и ширины входа. | Да | Да | Да | |
Deep Learning Toolbox | Макс. слой необъединения не объединяет выход макс. слоя объединения. | Да | Да | Нет |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | Слой сложения добавляет входные параметры из нескольких поэлементных слоев нейронной сети. | Да | Да | Да | |
Deep Learning Toolbox | Слой конкатенации глубины берет входные параметры, которые имеют ту же высоту и ширину, и конкатенирует их по третьему измерению (размерность канала). | Да | Да | Да | |
Deep Learning Toolbox | Слой конкатенации берет входные параметры и конкатенирует их в заданном измерении. | Да | Да | Нет |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Computer Vision Toolbox™ | Слой поля привязки хранит поля привязки для карты функции, используемой в сетях обнаружения объектов. | Да | Да | Да | |
Computer Vision Toolbox | Слой слияния SSD объединяет выходные параметры карт функции для последующей регрессии и расчета классификации потерь. | Да | Да | Нет | |
Computer Vision Toolbox | Создайте выходной слой для сети обнаружения объектов YOLO v2. | Да | Да | Да | |
Computer Vision Toolbox | Создайте слой перестройки для сети обнаружения объектов YOLO v2. | Да | Да | Да | |
Computer Vision Toolbox | Создайте преобразовывают слой для сети обнаружения объектов YOLO v2. | Да | Да | Да |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
Deep Learning Toolbox | softmax слой применяет функцию softmax к входу. | Да | Да | Да | |
Deep Learning Toolbox | Слой классификации вычисляет потерю перекрестной энтропии для многоклассовых задач классификации со взаимоисключающими классами. | Да | Да | Да | |
Deep Learning Toolbox | Слой регрессии вычисляет половину потери среднеквадратической ошибки для проблем регрессии. | Да | Да | Да | |
Computer Vision Toolbox | Слой классификации пикселей обеспечивает категориальную метку для каждого пикселя изображения или вокселя. | Да | Да | Да | |
Computer Vision Toolbox | Слой классификации пикселей Dice обеспечивает категориальную метку для каждого пикселя изображения, или воксель с помощью обобщил Dice Loss. | Да | Да | Да | |
| Deep Learning Toolbox | Все выходные слои включая пользовательскую классификацию или регрессию выводят слои, созданные при помощи Для примера, показывающего, как задать пользовательскую классификацию выходной слой и задать функцию потерь, смотрите, Задают Пользовательскую Классификацию Выходной Слой (Deep Learning Toolbox). Для примера, показывающего, как задать пользовательскую регрессию выходной слой и задать функцию потерь, смотрите, Задают Пользовательскую Регрессию Выходной Слой (Deep Learning Toolbox). | Да | Да | Да |
Имя слоя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
| Deep Learning Toolbox | Сгладьте активации в 1D C-стиль принятия (упорядоченный по строкам) порядок. | Да | Да | Да |
| Deep Learning Toolbox | Глобальный средний слой объединения для пространственных данных. | Да | Да | Да |
| Deep Learning Toolbox | Сигмоидальный слой активации. | Да | Да | Да |
| Deep Learning Toolbox | Гиперболический слой активации касательной. | Да | Да | Да |
| Deep Learning Toolbox | Нулевой дополнительный слой для 2D входа. | Да | Да | Да |
| Deep Learning Toolbox | Слой, который выполняет поэлементное масштабирование входа, сопровождаемого сложением. | Да | Да | Да |
| Deep Learning Toolbox | Сглаживает пространственные размерности входного тензора к размерностям канала. | Да | Да | Да |
| Deep Learning Toolbox | Слой, который реализует единичный оператор ONNX. | Да | Да | Да |
Следующие классы поддерживаются для генерации кода GPU Coder для целевых библиотек глубокого обучения, заданных в таблице.
Имя | Продукт | Описание | cuDNN | TensorRT | ARM вычисляет библиотеку для Мали графический процессор |
---|---|---|---|---|---|
yolov2ObjectDetector | Computer Vision Toolbox | Обнаружьте объекты с помощью детектора объектов YOLO v2
| Да | Да | Да |
ssdObjectDetector | Computer Vision Toolbox | Объект обнаружить объекты с помощью основанного на SSD детектора.
| Да | Да | Нет |
codegen
| coder.CodeConfig
| coder.CuDNNConfig
| coder.DeepLearningConfig
| coder.EmbeddedCodeConfig
| coder.getDeepLearningLayers
| coder.gpuConfig
| coder.gpuEnvConfig