cnncodegen

Сгенерируйте код для нейронной сети для глубокого обучения для целевого графического процессора ARM Mali

Синтаксис

cnncodegen(net,'targetlib','arm-compute-mali')

cnncodegen(net,'targetlib','arm-compute-mali',targetparams)

Описание

cnncodegen(net,'targetlib','arm-compute-mali') генерирует код С++ для заданного сетевого объекта при помощи ARM^® Вычислите библиотеку для графических процессоров Mali.

Требуется продукт GPU Coder™ и интерфейс GPU Coder для библиотек глубокого обучения.

пример

cnncodegen(net,'targetlib','arm-compute-mali',targetparams) генерирует код С++ для заданного сетевого объекта при помощи ARM Compute Library для графических процессоров Мали с дополнительными опциями генерации кода.

Примеры

свернуть все

Сгенерируйте код С++ для предварительно обученной сети, которая будет запускаться на процессоре ARM

Использовать cnncodegen чтобы сгенерировать код С++ для предварительно обученной сети для развертывания на графическом процессоре ARM Mali.

Получите предварительно обученную модель GoogLeNet при помощи googlenet (Deep Learning Toolbox) функция. Эта функция требует модели Deep Learning Toolbox™ для сети GoogLeNet. Если вы не установили этот пакет поддержки, функция предоставляет ссылку для загрузки. Также см. https://www.mathworks.com/matlabcentral/fileexchange/64456-deep-learning-toolbox-model-for-googlenet-network.

net = googlenet;

Сгенерируйте код при помощи cnncodegen с 'targetlib' установлено на 'arm-compute-mali'. По умолчанию генератор кода нацелен на версию '19.05' АРМ. Чтобы использовать другую версию вычислительной библиотеки, используйте 'ArmComputeVersion' параметр.

cnncodegen(net,'targetlib','arm-compute-mali'...
,'targetparams',struct('ArmComputeVersion','19.02'));

------------------------------------------------------------------------
Compilation suppressed: generating code only.
------------------------------------------------------------------------
### Codegen Successfully Generated for arm device

Генератор кода генерирует .cpp и заголовочные файлы в '/pwd/codegen' папка. Сеть DAG генерируется как класс C++, вызываемый CnnMain, содержащего массив из 87 классов слоев. Генератор кода уменьшает количество слоев путем оптимизации слияния слоев сверточной и пакетной нормализации. The setup() метод этого класса настраивает указатели и выделяет ресурсы для каждого объекта слоя. The predict() способ вызывает предсказание для каждого из 87 слоев в сети. The cleanup() метод освобождает все ресурсы памяти и системы, выделенные для каждого объекта слоя. Все бинарные веса (cnn_**_w) и файлы смещения (cnn_**_b) для свертки слои сети хранятся в codegen папка.

Чтобы создать библиотеку, переместите сгенерированный код на целевую платформу ARM и используйте сгенерированный make-файл cnnbuild_rtw.mk.

Входные параметры

свернуть все

`net` - Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

Предварительно обученные SeriesNetwork или DAGNetwork объект.

Примечание

cnncodegen не поддерживает dlnetwork объекты.

`targetparams` - Специфичные для библиотеки параметры
структура

Параметры ARM Compute Library заданы как 1-by- 1 структура, содержащая поля, описанные в этих таблицах.

Область	Описание
`ArmComputeVersion`	Версия ARM Compute Library на целевом компьютере, заданная как `'19.02'` или `'19.05'`. Значение по умолчанию `'19.05'`. Если вы задаете `ArmComputeVersion` на версию позже `'19.05'`, `ArmComputeVersion` установлено в `'19.05'`.

Вопросы совместимости

расширить все

Изменения в поддержке целевой библиотеки

Предупреждает, начиная с R2021a

В будущем релизе, cnncodegen функция сгенерирует код С++ и make-файлы для создания статической библиотеки только для процессора ARM Mali GPU. Можно продолжать использовать 'arm-compute-mali' значение для 'targetlib' аргумент для целевого графического процессора ARM Mali с помощью библиотеки ARM Compute Library для компьютерного зрения и машинного обучения.

Для всех других целей используйте codegen команда. Написание функции точки входа в MATLAB^® который использует coder.loadDeepLearningNetwork функция для загрузки модели глубокого обучения и вызовов predict (Deep Learning Toolbox), чтобы предсказать ответы. Для примера,

function out = googlenet_predict(in) %#codegen

persistent mynet;

if isempty(mynet)
    mynet = coder.loadDeepLearningNetwork('googlenet');
end

% pass in input   
out = predict(mynet,in);

Эта таблица показывает некоторые типичные использования cnncodegen и как обновить свой код, чтобы использовать codegen вместо этого.

Целевой рабочий процесс Не рекомендуется Рекомендуется

Целевой рабочий процесс	Не рекомендуется	Рекомендуется
Процессор ARM CPU, поддерживающий `NEON` инструкции	Установите `'targetlib'` параметр в `'arm-compute'`. Укажите версию ARM Compute Library для генерации кода и архитектуры ARM на целевом компьютере при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'arm-compute','targetparams' ... ,struct('ArmComputeVersion'... ,'19.02','ArmArchitecture'... ,'armv8')) Другие поддерживаемые версии ARM Compute Library `'18.11'`, `'19.02'`, `'19.05'`, или `'20.02.1'`. Значение по умолчанию `'20.02.1'`. Если вы задаете `ArmComputeVersion` на версию позже `'20.02.1'`, `ArmComputeVersion` установлено в `'20.02.1'` Вы можете задать архитектуру ARM следующим `'armv7` или `'armv8'`. Указанная архитектура должна совпадать с архитектурой ARM Compute Library на целевом компьютере.	Создайте `coder.config` объект строения для генерации статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создайте `coder.ARMNEONConfig` объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект строения. dlcfg = coder.DeepLearningConfig ... ('arm-compute'); dlcfg.ArmArchitecture = 'armv8'; dlcfg.ArmComputeVersion = '19.02'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция для задания `cfg` объект строения. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` опция для задания размера входного параметра функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения с ARM Compute Library.
NVIDIA^® Графические процессоры при помощи CUDA^® Библиотека глубоких нейронных сетей (cuDNN)	Установите `'targetlib'` параметр в `'cudnn'`. Задайте свойства библиотеки cuDNN при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability'... ,'7.0','targetparams' ... ,struct('AutoTuning',true ... ,'DataType','INT8'... ,'CalibrationResultFile' ... 'myInt8Cal.mat')) Функция автоматической настройки позволяет библиотеке cuDNN находить самые быстрые алгоритмы свертки. The `'DataType'` параметр задает точность расчетов вывода в поддерживаемых слоях. При выполнении вывода в 32-битных плавающих точках используйте `'FP32'`.	Создайте `coder.gpuConfig` объект строения для генерации статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойство объекта строения кода GPU. cfg.GpuConfig.ComputeCapability = '7.0'; Создайте `coder.CuDNNConfig` объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект строения. dlcfg = coder.DeepLearningConfig('cudnn'); dlcfg.AutoTuning = true; dlcfg.DataType = 'int8'; dlcfg.CalibrationResultFile = 'myInt8Cal.mat'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция для задания `cfg` объект строения. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` опция для задания размера входного параметра функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения при помощи cuDNN.
Intel^® Центральный процессор	Чтобы использовать Math Kernel Library для глубоких нейронных сетей (MKL-DNN) для центральных процессоров Intel, установите `'targetlib'` параметр в `'mkldnn'`. cnncodegen(net,'targetlib'... ,'mkldnn');	Создайте `coder.config` объект строения для генерации статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создайте `coder.MklDNNConfig` объект строения глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект строения. dlcfg = coder.DeepLearningConfig... ('mkldnn'); cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция для задания `cfg` объект строения. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` опция для задания размера входного параметра функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения с MKL-DNN.
Графические процессоры NVIDIA с использованием TensorRT™ NVIDIA, оптимизатора вывода эффективности глубокого обучения и библиотеки во время выполнения	Установите `'targetlib'` параметр в `'tensorrt'`. Задайте свойства библиотеки TensorRT при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'tensorrt','ComputeCapability'... ,'7.0','targetparams' ... ,struct('DataType','INT8' ... 'DataPath','image_dataset'... ,'NumCalibrationBatches',50))	Создайте `coder.gpuConfig` объект строения для генерации статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойство объекта строения кода GPU. cfg.GpuConfig.ComputeCapability = '7.0'; Создайте `coder.TensorRTConfig` объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект строения. dlcfg = coder.DeepLearningConfig... ('cudnn'); dlcfg.DataType = 'int8'; dlcfg.DataPath = 'image_dataset'; dlcfg.NumCalibrationBatches = 50; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция для задания `cfg` объект строения. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` опция для задания размера входного параметра функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Глубокое обучение Предсказание при помощи NVIDIA TensorRT.
Общие опции	Сгенерируйте код, не генерируя и не создавая make-файл. Для примера, cnncodegen(net,'targetlib' ... ,'mkldnn','codegenonly',1);	Чтобы создать исходный код, не вызывая команду make или объектный код сборки, используйте `GenCodeOnly` свойство `coder.CodeConfig` или `coder.GPUCodeConfig` объект. Для примера, cfg = coder.codeConfig('lib'); cfg.GenCodeOnly = true;
Установка вычислительной возможности графического процессора NVIDIA для компиляции. Аргумент принимает формат `major#.minor#`. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability','7.0');	Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойство объекта строения кода GPU. cfg = coder.gpuConfig('lib'); cfg.GpuConfig.ComputeCapability = '7.0';

Процессор ARM CPU, поддерживающий NEON инструкции

Установите 'targetlib' параметр в 'arm-compute'. Укажите версию ARM Compute Library для генерации кода и архитектуры ARM на целевом компьютере при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'arm-compute','targetparams' ...
,struct('ArmComputeVersion'...
,'19.02','ArmArchitecture'...
,'armv8'))

Другие поддерживаемые версии ARM Compute Library '18.11', '19.02', '19.05', или '20.02.1'. Значение по умолчанию '20.02.1'. Если вы задаете ArmComputeVersion на версию позже '20.02.1', ArmComputeVersion установлено в '20.02.1'

Вы можете задать архитектуру ARM следующим 'armv7 или 'armv8'. Указанная архитектура должна совпадать с архитектурой ARM Compute Library на целевом компьютере.

Создайте coder.config объект строения для генерации статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создайте coder.ARMNEONConfig объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект строения.

dlcfg = coder.DeepLearningConfig ...
('arm-compute');
dlcfg.ArmArchitecture = 'armv8';
dlcfg.ArmComputeVersion = '19.02';
cfg.DeepLearningConfig = dlcfg;

Используйте -config опция codegen функция для задания cfg объект строения. codegen функция должна определять размер, класс и сложность входов функции MATLAB. Используйте -args опция для задания размера входного параметра функции точки входа.

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения с ARM Compute Library.

NVIDIA^® Графические процессоры при помощи CUDA^® Библиотека глубоких нейронных сетей (cuDNN)

Установите 'targetlib' параметр в 'cudnn'. Задайте свойства библиотеки cuDNN при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability'...
,'7.0','targetparams' ...
,struct('AutoTuning',true ...
,'DataType','INT8'...
,'CalibrationResultFile' ...
'myInt8Cal.mat'))

Функция автоматической настройки позволяет библиотеке cuDNN находить самые быстрые алгоритмы свертки.

The 'DataType' параметр задает точность расчетов вывода в поддерживаемых слоях. При выполнении вывода в 32-битных плавающих точках используйте 'FP32'.

Создайте coder.gpuConfig объект строения для генерации статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

Чтобы задать минимальную вычислительную способность для генерации кода, используйте ComputeCapability свойство объекта строения кода GPU.

cfg.GpuConfig.ComputeCapability = '7.0';

Создайте coder.CuDNNConfig объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект строения.

dlcfg = coder.DeepLearningConfig('cudnn');
dlcfg.AutoTuning = true;
dlcfg.DataType = 'int8';
dlcfg.CalibrationResultFile = 'myInt8Cal.mat';
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения при помощи cuDNN.

Intel^® Центральный процессор

Чтобы использовать Math Kernel Library для глубоких нейронных сетей (MKL-DNN) для центральных процессоров Intel, установите 'targetlib' параметр в 'mkldnn'.

cnncodegen(net,'targetlib'...
,'mkldnn');

Создайте coder.config объект строения для генерации статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создайте coder.MklDNNConfig объект строения глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект строения.

dlcfg = coder.DeepLearningConfig...
('mkldnn');
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Генерацию кода для нейронных сетей для глубокого обучения с MKL-DNN.

Графические процессоры NVIDIA с использованием TensorRT™ NVIDIA, оптимизатора вывода эффективности глубокого обучения и библиотеки во время выполнения

Установите 'targetlib' параметр в 'tensorrt'. Задайте свойства библиотеки TensorRT при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'tensorrt','ComputeCapability'...
,'7.0','targetparams' ...
,struct('DataType','INT8' ...
'DataPath','image_dataset'...
,'NumCalibrationBatches',50))

Создайте coder.gpuConfig объект строения для генерации статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

cfg.GpuConfig.ComputeCapability = '7.0';

Создайте coder.TensorRTConfig объект строения глубокого обучения. Задайте специфичные для целевой библиотеки свойства объекта строения глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект строения.

dlcfg = coder.DeepLearningConfig...
('cudnn');
dlcfg.DataType = 'int8';
dlcfg.DataPath = 'image_dataset';
dlcfg.NumCalibrationBatches = 50;
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Глубокое обучение Предсказание при помощи NVIDIA TensorRT.

Общие опции

Сгенерируйте код, не генерируя и не создавая make-файл. Для примера,

cnncodegen(net,'targetlib' ...
,'mkldnn','codegenonly',1);

Чтобы создать исходный код, не вызывая команду make или объектный код сборки, используйте GenCodeOnly свойство coder.CodeConfig или coder.GPUCodeConfig объект. Для примера,

cfg = coder.codeConfig('lib');
cfg.GenCodeOnly = true;

Установка вычислительной возможности графического процессора NVIDIA для компиляции. Аргумент принимает формат major#.minor#.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability','7.0');

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.ComputeCapability = '7.0';

Документация

cnncodegen

Синтаксис

Описание

Примеры

Сгенерируйте код С++ для предварительно обученной сети, которая будет запускаться на процессоре ARM

Входные параметры

`net` - Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

`targetparams` - Специфичные для библиотеки параметры
структура

Вопросы совместимости

Изменения в поддержке целевой библиотеки

См. также

Функции

Темы

Документация по GPU Coder

Поддержка

Документация

cnncodegen

Синтаксис

Описание

Примеры

Сгенерируйте код С++ для предварительно обученной сети, которая будет запускаться на процессоре ARM

Входные параметры

net - Предварительно обученный объект нейронной сети для глубокого обучения вектор символов | строковый скаляр

targetparams - Специфичные для библиотеки параметры структура

Вопросы совместимости

Изменения в поддержке целевой библиотеки

См. также

Функции

Темы

Документация по GPU Coder

Поддержка

`net` - Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

`targetparams` - Специфичные для библиотеки параметры
структура