Сгенерируйте код и создайте статическую библиотеку для Ряда или Сети DAG
cnncodegen(net,'targetlib',libraryname)
cnncodegen(net,'targetlib',libraryname,Name,Value)
cnncodegen(
генерирует Код С++ и создает статическую библиотеку для заданного сетевого объекта и целевую библиотеку при помощи значений по умолчанию для всех свойств.net
,'targetlib',libraryname
)
cnncodegen(
генерирует Код С++ и создает статическую библиотеку для заданного сетевого объекта и целевую библиотеку с опциями генерации дополнительного кода, заданными одним или несколькими аргументами пары net
,'targetlib',libraryname
,Name,Value
)Name,Value
.
Используйте cnncodegen
, чтобы сгенерировать Код С++ для предварительно обученной сети для развертывания на процессоре ARM.
Получите предварительно обученную модель AlexNet при помощи функции alexnet
. Эта функция требует Модели Deep Learning Toolbox™ для Сети AlexNet. Если вы не установили этот пакет поддержки, функция обеспечивает ссылку на загрузку. Также см. Модель Deep Learning Toolbox для Сети AlexNet.
net = alexnet;
Сгенерируйте код при помощи cnncodegen
с набором 'targetlib'
к 'arm-compute'
. Для 'arm-compute'
необходимо обеспечить параметр 'ArmArchitecture'
.
cnncodegen(net,'targetlib','arm-compute','targetparams',struct('ArmComputeVersion','18.05','ArmArchitecture','armv8'));
Сгенерируйте Код С++ CUDA® от объекта SeriesNetwork
, созданного для архитектуры YOLO, обученной классификации набора данных PASCAL. Этот пример требует продукта GPU Coder™ и Интерфейса GPU Coder для Библиотек Глубокого обучения.
Получите предварительно обученную сеть YOLO и преобразуйте ее в объект SeriesNetwork
.
url = 'https://www.mathworks.com/supportfiles/gpucoder/cnn_models/Yolo/yolonet.mat'; websave('yolonet.mat',url); net = coder.loadDeepLearningNetwork('yolonet.mat');
Объект SeriesNetwork
net
содержит 58 слоев. Эти слои являются слоями свертки, сопровождаемыми текучим ReLU
и полносвязными слоями в конце сетевой архитектуры. Можно использовать net.Layers
, чтобы видеть все слои в этой сети.
Используйте функцию cnncodegen
, чтобы сгенерировать код CUDA.
cnncodegen(net,'targetlib','cudnn');
Генератор кода генерирует .cu
и заголовочные файлы в папке '/pwd/codegen'
. Серийная сеть сгенерирована как класс C++ под названием CnnMain
, содержа массив 58 классов слоя. Метод setup()
этого класса настраивает указатели и выделяет ресурсы для каждого расположенного на слое объекта. Метод predict()
вызывает прогноз для каждого из этих 58 слоев в сети. Метод cleanup()
выпускает все ресурсы памяти и системные ресурсы, выделенные для каждого расположенного на слое объекта. Все бинарные веса (cnn_**_w
) и файлы смещения (cnn_**_b
) для слоев свертки сети хранятся в папке codegen
. Файлы скомпилированы в статическую библиотеку cnnbuild.a
(на Linux®) или cnnbuild.lib
(на Windows®).
.NET
Имя ряда или сетевого объекта DAGОбъект Pretrained SeriesNetwork
или DAGNetwork
.
libraryname
— Целевая библиотека глубокого обученияЦелевая библиотека и целевая платформа, чтобы сгенерировать код для, заданный как одно из значений в этой таблице.
Значение | Описание |
---|---|
'arm-compute' | Цель процессор CPU ARM®, поддерживающий инструкции Требует MATLAB® Coder™ Interface для библиотек глубокого обучения. |
'cudnn' | Предназначайтесь для NVIDIA® графические процессоры при помощи библиотеки CUDA Deep Neural Network (cuDNN). Требует продукта GPU Coder и Интерфейса GPU Coder для Библиотек Глубокого обучения. |
'mkldnn' | Предназначайтесь для процессора CPU Intel® при помощи Math Kernel Library Intel для Глубоких нейронных сетей (MKL-DNN). Требует интерфейса MATLAB Coder для библиотек глубокого обучения. |
'tensorrt' | Предназначайтесь для NVIDIA графические процессоры при помощи NVIDIA TensorRT™, высокоэффективного оптимизатора вывода глубокого обучения и библиотеки времени выполнения. Требует продукта GPU Coder и Интерфейса GPU Coder для Библиотек Глубокого обучения. |
Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми.
Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение.
Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
cnncodegen(net,'targetlib','mkldnn','codegenonly',0,'batchsize',1)
генерирует Код С++ для процессора Intel при помощи MKL-DNN и создает статическую библиотеку для сетевого объекта в net
.'batchsize'
— РазмерПоложительное ненулевое целочисленное значение, задающее количество наблюдений, чтобы работать с в одном вызове метода сети predict()
. При вызове network->predict()
размер входных данных должен совпадать со значением batchsize
, заданным во время cnncodegen
.
Если libraryname
является 'arm-compute'
, значением batchsize
должен быть 1
.
'codegenonly'
— ФлагБулев флаг, который, когда включено, генерирует код CUDA, не генерируя и создавая make-файл.
'targetparams'
— Специфичные для библиотеки параметрыСпецифичные для библиотеки параметры, заданные как 1
-by-1
структура, содержащая поля, описаны в этих таблицах.
Параметры для ARM вычисляют библиотеку
Поле | Описание |
---|---|
ArmComputeVersion | Версия ARM Вычисляет Библиотеку по целевому компьютеру, заданному как |
ArmArchitecture | Архитектура ARM поддержана на целевом компьютере, заданном как
|
Параметры для библиотеки NVIDIA cuDNN
Поле | Описание |
---|---|
AutoTuning | Включите или отключите автоматическую настраивающую опцию. Включение автоматической настройки позволяет cuDNN библиотеке находить самые быстрые алгоритмы свертки. Это увеличивает производительность для больших сетей, таких как SegNet и ResNet. Значением по умолчанию является ПримечаниеЕсли |
Параметры для библиотеки NVIDIA TensorRT
Поле | Описание |
---|---|
DataType | Задайте точность входа типа данных тензора к сети или тензору вывод слоя. При выполнении вывода в 32-битных плаваниях используйте Аргумент Аргумент |
DataPath | Местоположение набора данных изображений используется во время перекалибровки. Значением по умолчанию является Когда вы выбираете опцию |
NumCalibrationBatches | Числовое значение, задающее пакетный размер для калибровки. Это значение не должно быть больше, чем количество изображений, существующих в наборе данных изображений. Эта опция применима только, когда |
'computecapability'
— Вычислите версию'3.5'
(значение по умолчанию) | вектор символовЭто свойство влияет на графический процессор, предназначающийся только.
Вектор символов, задающий графический процессор NVIDIA, вычисляет возможность скомпилировать для. Аргумент берет формат major#.minor#
. Возможными значениями является '3.2'|'3.5'|'3.7'|'5.0'|'5.2'|'5.3'|'6.0'|'6.1'|'6.2'|'7.0'|'7.1'|'7.2'
.
'targetarch'
— Целевая архитектураЭто свойство влияет на графический процессор, предназначающийся только.
Задайте целевую архитектуру, для которой вы хотите сгенерировать и скомпилировать код CUDA.
Значение | Описание |
---|---|
'host' | Предназначайтесь для устройства графического процессора на хост-машине. |
'tk1' | Предназначайтесь для платы NVIDIA Tegra® Tk1. Эта опция требует набора инструментальных средств |
'tx1' | Предназначайтесь для платы NVIDIA Tegra TX1. Эта опция требует набора инструментальных средств |
'tx2' | Предназначайтесь для платы NVIDIA Tegra TX2. Эта опция требует набора инструментальных средств |
codegen
| coder.loadDeepLearningNetwork
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.