cnncodegen

Сгенерируйте код для нейронной сети для глубокого обучения, чтобы предназначаться для графического процессора ARM Mali

Синтаксис

cnncodegen(net,'targetlib','arm-compute-mali')

cnncodegen(net,'targetlib','arm-compute-mali',targetparams)

Описание

cnncodegen(net,'targetlib','arm-compute-mali') генерирует Код С++ для заданного сетевого объекта при помощи Библиотеки ARM^® Compute для Мали графические процессоры.

Требует продукта GPU Coder™ и Интерфейса GPU Coder для Библиотек Глубокого обучения.

пример

cnncodegen(net,'targetlib','arm-compute-mali',targetparams) генерирует Код С++ для заданного сетевого объекта при помощи ARM, Вычисляют Библиотеку для Мали графические процессоры с опциями генерации дополнительного кода.

Примеры

свернуть все

Сгенерируйте код С++ для предварительно обученной сети, чтобы работать на процессоре ARM

Использование cnncodegen сгенерировать Код С++ для предварительно обученной сети для развертывания на ARM графический процессор Мали.

Получите предварительно обученную модель GoogLeNet при помощи googlenet (Deep Learning Toolbox) функция. Эта функция требует Модели Deep Learning Toolbox™ для Сети GoogLeNet. Если вы не установили этот пакет поддержки, функция обеспечивает ссылку на загрузку. В качестве альтернативы см. https://www.mathworks.com/matlabcentral/fileexchange/64456-deep-learning-toolbox-model-for-googlenet-network.

net = googlenet;

Сгенерируйте код при помощи cnncodegen с 'targetlib' установите на 'arm-compute-mali'. По умолчанию генератор кода предназначается для версии '19.05' из ARM. Чтобы предназначаться для различной версии Вычислить Библиотеки, используйте 'ArmComputeVersion' параметр.

cnncodegen(net,'targetlib','arm-compute-mali'...
,'targetparams',struct('ArmComputeVersion','19.02'));

------------------------------------------------------------------------
Compilation suppressed: generating code only.
------------------------------------------------------------------------
### Codegen Successfully Generated for arm device

Генератор кода генерирует .cpp и заголовочные файлы в '/pwd/codegen' папка. Сеть DAG сгенерирована как класс C++ под названием CnnMain, содержа массив 87 классов слоя. Генератор кода сокращает количество слоев, оптимизацией сплава слоя слоев нормализации партии. и сверточных. setup() метод этого класса настраивает указатели и выделяет ресурсы для каждого расположенного на слое объекта. predict() метод вызывает предсказание для каждого из этих 87 слоев в сети. cleanup() метод выпускает все ресурсы памяти и системные ресурсы, выделенные для каждого расположенного на слое объекта. Все бинарные веса (cnn_**_w) и файлы смещения (cnn_**_b) поскольку слои свертки сети хранятся в codegen папка.

Чтобы создать библиотеку, переместите сгенерированный код в целевую платформу ARM и используйте сгенерированный make-файл cnnbuild_rtw.mk.

Входные параметры

свернуть все

`net` — Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

Предварительно обученный SeriesNetwork или DAGNetwork объект.

Примечание

cnncodegen не поддерживает dlnetwork объекты.

`targetparams` — Специфичные для библиотеки параметры
структура

ARM Вычисляет Специфичные для библиотеки параметры, заданные как 1- 1 структура, содержащая поля, описана в этих таблицах.

Поле	Описание
`ArmComputeVersion`	Версия ARM Вычисляет Библиотеку по целевому компьютеру в виде `'19.02'` или `'19.05'`. Значением по умолчанию является `'19.05'`. Если вы устанавливаете `ArmComputeVersion` к версии позже, чем `'19.05'`, `ArmComputeVersion` установлен в `'19.05'`.

Вопросы совместимости

развернуть все

Изменения, чтобы предназначаться для поддержки библиотеки

Предупреждает запуск в R2021a

В будущем релизе, cnncodegen функция сгенерирует Код С++ и make-файлы, чтобы создать статическую библиотеку только для ARM процессор GPU Мали. Можно продолжить использовать 'arm-compute-mali' значение для 'targetlib' аргумент, чтобы предназначаться для графического процессора ARM Mali при помощи ARM Вычисляет Библиотеку для компьютерного зрения и машинного обучения.

Для всех других целей используйте codegen команда. Напишите функцию точки входа в MATLAB^®, который использует coder.loadDeepLearningNetwork функционируйте, чтобы загрузить модель глубокого обучения и вызовы predict (Deep Learning Toolbox), чтобы предсказать ответы. Например,

function out = googlenet_predict(in) %#codegen

persistent mynet;

if isempty(mynet)
    mynet = coder.loadDeepLearningNetwork('googlenet');
end

% pass in input   
out = predict(mynet,in);

Эта таблица показывает некоторые типичные использования cnncodegen и как обновить ваш код, чтобы использовать codegen вместо этого.

Целевой рабочий процесс Не рекомендуемый Рекомендуемый

Целевой рабочий процесс	Не рекомендуемый	Рекомендуемый
Процессор ARM CPU, поддерживающий `NEON` инструкции	Установите `'targetlib'` параметр к `'arm-compute'`. Укажите, что ARM Вычисляет версию Библиотеки, чтобы сгенерировать код для и архитектуру ARM на целевом компьютере при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'arm-compute','targetparams' ... ,struct('ArmComputeVersion'... ,'19.02','ArmArchitecture'... ,'armv8')) Другие поддерживаемые версии ARM Вычисляют Библиотеку, `'18.11'`, '19.02', '19.05', или `'20.02.1'`. Значением по умолчанию является `'20.02.1'`. Если вы устанавливаете `ArmComputeVersion` к версии позже, чем `'20.02.1'`, `ArmComputeVersion` установлен в `'20.02.1'` Можно задать архитектуру ARM как `'armv7` или `'armv8'`. Заданная архитектура должна быть эквивалентной, архитектура для ARM Вычисляют Библиотеку по целевому компьютеру.	Создайте `coder.config` объект настройки для генерации статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создайте `coder.ARMNEONConfig` объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект настройки. dlcfg = coder.DeepLearningConfig ... ('arm-compute'); dlcfg.ArmArchitecture = 'armv8'; dlcfg.ArmComputeVersion = '19.02'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция, чтобы задать `cfg` объект настройки. `codegen` функция должна определить размер, класс и сложность входных параметров функции MATLAB. Используйте `-args` опция, чтобы задать размер входа к функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите, что Генерация кода для Нейронных сетей для глубокого обучения с ARM Вычисляет Библиотеку.
NVIDIA^® графические процессоры при помощи библиотеки CUDA^® Deep Neural Network (cuDNN)	Установите `'targetlib'` параметр к `'cudnn'`. Задайте cuDNN специфичные для библиотеки свойства при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability'... ,'7.0','targetparams' ... ,struct('AutoTuning',true ... ,'DataType','INT8'... ,'CalibrationResultFile' ... 'myInt8Cal.mat')) Автоматическая настраивающая функция позволяет cuDNN библиотеке находить самые быстрые алгоритмы свертки. `'DataType'` параметр задает точность расчетов вывода в поддерживаемых слоях. При выполнении вывода в 32-битных плаваниях используйте `'FP32'`.	Создайте `coder.gpuConfig` объект настройки для генерации статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы установить минимум вычисляют возможность генерации кода, используют `ComputeCapability` свойство объекта настройки графического процессора кода. cfg.GpuConfig.ComputeCapability = '7.0'; Создайте `coder.CuDNNConfig` объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект настройки. dlcfg = coder.DeepLearningConfig('cudnn'); dlcfg.AutoTuning = true; dlcfg.DataType = 'int8'; dlcfg.CalibrationResultFile = 'myInt8Cal.mat'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция, чтобы задать `cfg` объект настройки. `codegen` функция должна определить размер, класс и сложность входных параметров функции MATLAB. Используйте `-args` опция, чтобы задать размер входа к функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Генерацию кода для Нейронных сетей для глубокого обучения при помощи cuDNN.
Процессор CPU Intel^®	Чтобы использовать Math Kernel Library Intel для Глубоких нейронных сетей (MKL-DNN) для центральных процессоров Intel, установите `'targetlib'` параметр к `'mkldnn'`. cnncodegen(net,'targetlib'... ,'mkldnn');	Создайте `coder.config` объект настройки для генерации статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создайте `coder.MklDNNConfig` объект настройки глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект настройки. dlcfg = coder.DeepLearningConfig... ('mkldnn'); cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция, чтобы задать `cfg` объект настройки. `codegen` функция должна определить размер, класс и сложность входных параметров функции MATLAB. Используйте `-args` опция, чтобы задать размер входа к функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации смотрите Генерацию кода для Нейронных сетей для глубокого обучения с MKL-DNN.
NVIDIA графические процессоры при помощи NVIDIA TensorRT™, высокоэффективного оптимизатора вывода глубокого обучения и библиотеки времени выполнения	Установите `'targetlib'` параметр к `'tensorrt'`. Задайте TensorRT специфичные для библиотеки свойства при помощи `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'tensorrt','ComputeCapability'... ,'7.0','targetparams' ... ,struct('DataType','INT8' ... 'DataPath','image_dataset'... ,'NumCalibrationBatches',50))	Создайте `coder.gpuConfig` объект настройки для генерации статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы установить минимум вычисляют возможность генерации кода, используют `ComputeCapability` свойство объекта настройки графического процессора кода. cfg.GpuConfig.ComputeCapability = '7.0'; Создайте `coder.TensorRTConfig` объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его `DeepLearningConfig` свойство `cfg` объект настройки. dlcfg = coder.DeepLearningConfig... ('cudnn'); dlcfg.DataType = 'int8'; dlcfg.DataPath = 'image_dataset'; dlcfg.NumCalibrationBatches = 50; cfg.DeepLearningConfig = dlcfg; Используйте `-config` опция `codegen` функция, чтобы задать `cfg` объект настройки. `codegen` функция должна определить размер, класс и сложность входных параметров функции MATLAB. Используйте `-args` опция, чтобы задать размер входа к функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Для получения дополнительной информации см. Предсказание Глубокого обучения при помощи NVIDIA TensorRT.
Общие опции	Сгенерируйте код, не генерируя и создавая make-файл. Например, cnncodegen(net,'targetlib' ... ,'mkldnn','codegenonly',1);	К продуктам исходный код, не вызывая сделать команду или объектный код сборки, используйте `GenCodeOnly` свойство `coder.CodeConfig` или `coder.GPUCodeConfig` объект. Например, cfg = coder.codeConfig('lib'); cfg.GenCodeOnly = true;
Определение графического процессора NVIDIA вычисляет возможность скомпилировать для. Аргумент берет формат `major#.minor#`. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability','7.0');	Чтобы установить минимум вычисляют возможность генерации кода, используют `ComputeCapability` свойство объекта настройки графического процессора кода. cfg = coder.gpuConfig('lib'); cfg.GpuConfig.ComputeCapability = '7.0';

Процессор ARM CPU, поддерживающий NEON инструкции

Установите 'targetlib' параметр к 'arm-compute'. Укажите, что ARM Вычисляет версию Библиотеки, чтобы сгенерировать код для и архитектуру ARM на целевом компьютере при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'arm-compute','targetparams' ...
,struct('ArmComputeVersion'...
,'19.02','ArmArchitecture'...
,'armv8'))

Другие поддерживаемые версии ARM Вычисляют Библиотеку, '18.11', '19.02', '19.05', или '20.02.1'. Значением по умолчанию является '20.02.1'. Если вы устанавливаете ArmComputeVersion к версии позже, чем '20.02.1', ArmComputeVersion установлен в '20.02.1'

Можно задать архитектуру ARM как 'armv7 или 'armv8'. Заданная архитектура должна быть эквивалентной, архитектура для ARM Вычисляют Библиотеку по целевому компьютеру.

Создайте coder.config объект настройки для генерации статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создайте coder.ARMNEONConfig объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект настройки.

dlcfg = coder.DeepLearningConfig ...
('arm-compute');
dlcfg.ArmArchitecture = 'armv8';
dlcfg.ArmComputeVersion = '19.02';
cfg.DeepLearningConfig = dlcfg;

Используйте -config опция codegen функция, чтобы задать cfg объект настройки. codegen функция должна определить размер, класс и сложность входных параметров функции MATLAB. Используйте -args опция, чтобы задать размер входа к функции точки входа.

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите, что Генерация кода для Нейронных сетей для глубокого обучения с ARM Вычисляет Библиотеку.

NVIDIA^® графические процессоры при помощи библиотеки CUDA^® Deep Neural Network (cuDNN)

Установите 'targetlib' параметр к 'cudnn'. Задайте cuDNN специфичные для библиотеки свойства при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability'...
,'7.0','targetparams' ...
,struct('AutoTuning',true ...
,'DataType','INT8'...
,'CalibrationResultFile' ...
'myInt8Cal.mat'))

Автоматическая настраивающая функция позволяет cuDNN библиотеке находить самые быстрые алгоритмы свертки.

'DataType' параметр задает точность расчетов вывода в поддерживаемых слоях. При выполнении вывода в 32-битных плаваниях используйте 'FP32'.

Создайте coder.gpuConfig объект настройки для генерации статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

Чтобы установить минимум вычисляют возможность генерации кода, используют ComputeCapability свойство объекта настройки графического процессора кода.

cfg.GpuConfig.ComputeCapability = '7.0';

Создайте coder.CuDNNConfig объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект настройки.

dlcfg = coder.DeepLearningConfig('cudnn');
dlcfg.AutoTuning = true;
dlcfg.DataType = 'int8';
dlcfg.CalibrationResultFile = 'myInt8Cal.mat';
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Генерацию кода для Нейронных сетей для глубокого обучения при помощи cuDNN.

Процессор CPU Intel^®

Чтобы использовать Math Kernel Library Intel для Глубоких нейронных сетей (MKL-DNN) для центральных процессоров Intel, установите 'targetlib' параметр к 'mkldnn'.

cnncodegen(net,'targetlib'...
,'mkldnn');

Создайте coder.config объект настройки для генерации статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создайте coder.MklDNNConfig объект настройки глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект настройки.

dlcfg = coder.DeepLearningConfig...
('mkldnn');
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации смотрите Генерацию кода для Нейронных сетей для глубокого обучения с MKL-DNN.

NVIDIA графические процессоры при помощи NVIDIA TensorRT™, высокоэффективного оптимизатора вывода глубокого обучения и библиотеки времени выполнения

Установите 'targetlib' параметр к 'tensorrt'. Задайте TensorRT специфичные для библиотеки свойства при помощи 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'tensorrt','ComputeCapability'...
,'7.0','targetparams' ...
,struct('DataType','INT8' ...
'DataPath','image_dataset'...
,'NumCalibrationBatches',50))

Создайте coder.gpuConfig объект настройки для генерации статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

cfg.GpuConfig.ComputeCapability = '7.0';

Создайте coder.TensorRTConfig объект настройки глубокого обучения. Задайте целевые специфичные для библиотеки свойства объекта настройки глубокого обучения. Присвойте его DeepLearningConfig свойство cfg объект настройки.

dlcfg = coder.DeepLearningConfig...
('cudnn');
dlcfg.DataType = 'int8';
dlcfg.DataPath = 'image_dataset';
dlcfg.NumCalibrationBatches = 50;
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Для получения дополнительной информации см. Предсказание Глубокого обучения при помощи NVIDIA TensorRT.

Общие опции

Сгенерируйте код, не генерируя и создавая make-файл. Например,

cnncodegen(net,'targetlib' ...
,'mkldnn','codegenonly',1);

К продуктам исходный код, не вызывая сделать команду или объектный код сборки, используйте GenCodeOnly свойство coder.CodeConfig или coder.GPUCodeConfig объект. Например,

cfg = coder.codeConfig('lib');
cfg.GenCodeOnly = true;

Определение графического процессора NVIDIA вычисляет возможность скомпилировать для. Аргумент берет формат major#.minor#.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability','7.0');

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.ComputeCapability = '7.0';

Документация

cnncodegen

Синтаксис

Описание

Примеры

Сгенерируйте код С++ для предварительно обученной сети, чтобы работать на процессоре ARM

Входные параметры

`net` — Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

`targetparams` — Специфичные для библиотеки параметры
структура

Вопросы совместимости

Изменения, чтобы предназначаться для поддержки библиотеки

Смотрите также

Функции

Темы

Документация GPU Coder

Поддержка

Документация

cnncodegen

Синтаксис

Описание

Примеры

Сгенерируйте код С++ для предварительно обученной сети, чтобы работать на процессоре ARM

Входные параметры

net — Предварительно обученный объект нейронной сети для глубокого обучения вектор символов | строковый скаляр

targetparams — Специфичные для библиотеки параметры структура

Вопросы совместимости

Изменения, чтобы предназначаться для поддержки библиотеки

Смотрите также

Функции

Темы

Документация GPU Coder

Поддержка

`net` — Предварительно обученный объект нейронной сети для глубокого обучения
вектор символов | строковый скаляр

`targetparams` — Специфичные для библиотеки параметры
структура