cnncodegen

Создание кода для сети глубокого обучения, предназначенной для графического процессора ARM Mali

Синтаксис

cnncodegen (net, 'targetlib', 'arm-compute-mali')

cnncodegen (net, 'targetlib', 'arm-compute-mali', targetparams)

Описание

cnncodegen(net,'targetlib','arm-compute-mali') создает код C++ для указанного сетевого объекта с помощью графического процессора ARM ® Compute Library для Мали.

Требуется графический процессор Coder™ и интерфейс кодера графического процессора для библиотек глубокого обучения.

пример

cnncodegen(net,'targetlib','arm-compute-mali',targetparams) генерирует код C++ для указанного сетевого объекта с помощью вычислительной библиотеки ARM для графических процессоров Мали с дополнительными опциями генерации кода.

Примеры

свернуть все

Создание кода C++ для предварительно обученной сети для работы на ARM-процессоре

Использовать cnncodegen для генерации кода C++ для предварительно обученной сети для развертывания на графическом процессоре ARM Mali.

Получите предварительно подготовленную модель GoogLeNet с помощью googlenet (Deep Learning Toolbox). Для этой функции требуется модель Deep Learning Toolbox™ для сети GoogLeNet. Если этот пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Кроме того, см. раздел https://www.mathworks.com/matlabcentral/fileexchange/64456-deep-learning-toolbox-model-for-googlenet-network.

net = googlenet;

Создание кода с помощью cnncodegen с 'targetlib' установить в значение 'arm-compute-mali'. По умолчанию генератор кода предназначен для версии '19.05' АРМ. Для назначения другой версии библиотеки вычислений используйте 'ArmComputeVersion' параметр.

cnncodegen(net,'targetlib','arm-compute-mali'...
,'targetparams',struct('ArmComputeVersion','19.02'));

------------------------------------------------------------------------
Compilation suppressed: generating code only.
------------------------------------------------------------------------
### Codegen Successfully Generated for arm device

Генератор кода генерирует .cpp и заголовочные файлы в '/pwd/codegen' папка. Сеть DAG создается как класс C++ с именем CnnMain, содержащий массив из 87 классов слоев. Генератор кода уменьшает количество слоев за счет оптимизации слоевого слияния слоев сверточной и пакетной нормализации. setup() метод этого класса устанавливает дескрипторы и выделяет ресурсы для каждого объекта уровня. predict() способ вызывает прогнозирование для каждого из 87 уровней в сети. cleanup() освобождает все память и системные ресурсы, выделенные для каждого объекта уровня. Все бинарные веса (cnn_**_w) и файлы смещения (cnn_**_b) для уровней свертки сети хранятся в codegen папка.

Чтобы построить библиотеку, переместите созданный код на целевую платформу ARM и используйте созданный make-файл cnnbuild_rtw.mk.

Входные аргументы

свернуть все

`net` - Предварительно обученный объект сети глубокого обучения
вектор символов | строковый скаляр

Предварительно обученный SeriesNetwork или DAGNetwork объект.

Примечание

cnncodegen не поддерживает dlnetwork объекты.

`targetparams` - Параметры, специфичные для библиотеки
структура

Параметры библиотеки вычислений ARM, указанные как 1около-1 структура, содержащая поля, описанные в этих таблицах.

Область	Описание
`ArmComputeVersion`	Версия вычислительной библиотеки ARM на целевом оборудовании, указанная как `'19.02'` или `'19.05'`. Значение по умолчанию: `'19.05'`. Если установить `ArmComputeVersion` до версии, более поздней, чем `'19.05'`, `ArmComputeVersion` имеет значение `'19.05'`.

Вопросы совместимости

развернуть все

Изменения в поддержке целевой библиотеки

Предупреждает, начиная с R2021a

В будущем выпуске, cnncodegen Функция (GPU Coder) генерирует код C++ и makefile для создания статической библиотеки только для процессора ARM Mali. Вы можете продолжать использовать 'arm-compute-mali' значение для 'targetlib' аргумент для нацеливания на графический процессор ARM Mali с помощью вычислительной библиотеки ARM для компьютерного зрения и машинного обучения.

Для всех других целей используйте codegen команда. Запишите функцию начального уровня в MATLAB ®, использующую coder.loadDeepLearningNetwork Функция (GPU Coder) для загрузки модели глубокого обучения и вызовов predict (Deep Learning Toolbox) для прогнозирования ответов. Например,

function out = googlenet_predict(in) %#codegen

persistent mynet;

if isempty(mynet)
    mynet = coder.loadDeepLearningNetwork('googlenet');
end

% pass in input   
out = predict(mynet,in);

В этой таблице показаны некоторые типичные виды использования cnncodegen и как обновить код для использования codegen вместо этого.

Целевой рабочий процесс Не рекомендуется Рекомендуется

Целевой рабочий процесс	Не рекомендуется	Рекомендуется
Процессор процессора ARM с поддержкой `NEON` инструкции	Установите `'targetlib'` параметр для `'arm-compute'`. Укажите версию вычислительной библиотеки ARM для создания кода и архитектуру ARM на целевом оборудовании с помощью `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'arm-compute','targetparams' ... ,struct('ArmComputeVersion'... ,'19.02','ArmArchitecture'... ,'armv8')) Другие поддерживаемые версии библиотеки вычислений ARM: `'18.11'`, `'19.02'`, `'19.05'`, или `'20.02.1'`. Значение по умолчанию: `'20.02.1'`. Если установить `ArmComputeVersion` до версии, более поздней, чем `'20.02.1'`, `ArmComputeVersion` имеет значение `'20.02.1'` Можно указать архитектуру ARM как `'armv7` или `'armv8'`. Указанная архитектура должна совпадать с архитектурой вычислительной библиотеки ARM на целевом оборудовании.	Создать `coder.config` объект конфигурации для создания статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создать `coder.ARMNEONConfig` объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его `DeepLearningConfig` имущества `cfg` объект конфигурации. dlcfg = coder.DeepLearningConfig ... ('arm-compute'); dlcfg.ArmArchitecture = 'armv8'; dlcfg.ArmComputeVersion = '19.02'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` вариант `codegen` для указания `cfg` объект конфигурации. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` для указания размера входных данных функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с помощью вычислительной библиотеки ARM.
Графические процессоры NVIDIA ® с использованием библиотеки CUDA ® Deep Neural Network (cuDNN)	Установите `'targetlib'` параметр для `'cudnn'`. Укажите свойства библиотеки cuDNN с помощью `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability'... ,'7.0','targetparams' ... ,struct('AutoTuning',true ... ,'DataType','INT8'... ,'CalibrationResultFile' ... 'myInt8Cal.mat')) Функция автоматической настройки позволяет библиотеке cuDNN находить самые быстрые алгоритмы свертки. `'DataType'` параметр определяет точность вычислений вывода в поддерживаемых слоях. При выполнении вывода в 32-разрядных поплавках используйте `'FP32'`.	Создать `coder.gpuConfig` объект конфигурации для создания статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойства объекта конфигурации кода графического процессора. cfg.GpuConfig.ComputeCapability = '7.0'; Создайте объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его `DeepLearningConfig` имущества `cfg` объект конфигурации. dlcfg = coder.DeepLearningConfig('cudnn'); dlcfg.AutoTuning = true; dlcfg.DataType = 'int8'; dlcfg.CalibrationResultFile = 'myInt8Cal.mat'; cfg.DeepLearningConfig = dlcfg; Используйте `-config` вариант `codegen` для указания `cfg` объект конфигурации. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` для указания размера входных данных функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с помощью cuDNN (GPU Coder).
Процессор Intel ® CPU	Чтобы использовать библиотеку Intel Math Kernel Library для глубоких нейронных сетей (MKL-DNN) для процессоров Intel, установите `'targetlib'` параметр для `'mkldnn'`. cnncodegen(net,'targetlib'... ,'mkldnn');	Создать `coder.config` объект конфигурации для создания статической библиотеки. cfg = coder.config('lib'); cfg.TargetLang = 'C++'; Создать `coder.MklDNNConfig` объект конфигурации глубокого обучения. Присвойте его `DeepLearningConfig` имущества `cfg` объект конфигурации. dlcfg = coder.DeepLearningConfig... ('mkldnn'); cfg.DeepLearningConfig = dlcfg; Используйте `-config` вариант `codegen` для указания `cfg` объект конфигурации. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` для указания размера входных данных функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с MKL-DNN.
Графические процессоры NVIDIA с помощью NVIDIA TensorRT™, высокопроизводительного оптимизатора выводов глубокого обучения и библиотеки времени выполнения	Установите `'targetlib'` параметр для `'tensorrt'`. Укажите свойства библиотеки TensorRT с помощью `'targetparams'` параметр. cnncodegen(net,'targetlib'... ,'tensorrt','ComputeCapability'... ,'7.0','targetparams' ... ,struct('DataType','INT8' ... 'DataPath','image_dataset'... ,'NumCalibrationBatches',50))	Создать `coder.gpuConfig` объект конфигурации для создания статической библиотеки. cfg = coder.gpuConfig('lib'); cfg.TargetLang = 'C++'; Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойства объекта конфигурации кода графического процессора. cfg.GpuConfig.ComputeCapability = '7.0'; Создать `coder.TensorRTConfig` (Кодер графического процессора) объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его `DeepLearningConfig` имущества `cfg` объект конфигурации. dlcfg = coder.DeepLearningConfig... ('cudnn'); dlcfg.DataType = 'int8'; dlcfg.DataPath = 'image_dataset'; dlcfg.NumCalibrationBatches = 50; cfg.DeepLearningConfig = dlcfg; Используйте `-config` вариант `codegen` для указания `cfg` объект конфигурации. `codegen` функция должна определять размер, класс и сложность входов функции MATLAB. Используйте `-args` для указания размера входных данных функции точки входа. arg = {ones(224,224,3,'single')}; codegen -args arg ... -config cfg googlenet_predict Дополнительные сведения см. в разделе Прогнозирование глубокого обучения с помощью NVIDIA TensorRT (GPU Coder).
Общие параметры	Создание кода без создания make-файла. Например, cnncodegen(net,'targetlib' ... ,'mkldnn','codegenonly',1);	Чтобы создать исходный код без вызова команды make или кода объекта построения, используйте команду `GenCodeOnly` имущества `coder.CodeConfig` или `coder.GPUCodeConfig` объект. Например, cfg = coder.codeConfig('lib'); cfg.GenCodeOnly = true;
Задание вычислительной способности графического процессора NVIDIA для компиляции. Аргумент принимает формат `major#.minor#`. cnncodegen(net,'targetlib'... ,'cudnn','ComputeCapability','7.0');	Чтобы задать минимальную вычислительную способность для генерации кода, используйте `ComputeCapability` свойства объекта конфигурации кода графического процессора. cfg = coder.gpuConfig('lib'); cfg.GpuConfig.ComputeCapability = '7.0';

Процессор процессора ARM с поддержкой NEON инструкции

Установите 'targetlib' параметр для 'arm-compute'. Укажите версию вычислительной библиотеки ARM для создания кода и архитектуру ARM на целевом оборудовании с помощью 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'arm-compute','targetparams' ...
,struct('ArmComputeVersion'...
,'19.02','ArmArchitecture'...
,'armv8'))

Другие поддерживаемые версии библиотеки вычислений ARM: '18.11', '19.02', '19.05', или '20.02.1'. Значение по умолчанию: '20.02.1'. Если установить ArmComputeVersion до версии, более поздней, чем '20.02.1', ArmComputeVersion имеет значение '20.02.1'

Можно указать архитектуру ARM как 'armv7 или 'armv8'. Указанная архитектура должна совпадать с архитектурой вычислительной библиотеки ARM на целевом оборудовании.

Создать coder.config объект конфигурации для создания статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создать coder.ARMNEONConfig объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его DeepLearningConfig имущества cfg объект конфигурации.

dlcfg = coder.DeepLearningConfig ...
('arm-compute');
dlcfg.ArmArchitecture = 'armv8';
dlcfg.ArmComputeVersion = '19.02';
cfg.DeepLearningConfig = dlcfg;

Используйте -config вариант codegen для указания cfg объект конфигурации. codegen функция должна определять размер, класс и сложность входов функции MATLAB. Используйте -args для указания размера входных данных функции точки входа.

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с помощью вычислительной библиотеки ARM.

Графические процессоры NVIDIA ® с использованием библиотеки CUDA ® Deep Neural Network (cuDNN)

Установите 'targetlib' параметр для 'cudnn'. Укажите свойства библиотеки cuDNN с помощью 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability'...
,'7.0','targetparams' ...
,struct('AutoTuning',true ...
,'DataType','INT8'...
,'CalibrationResultFile' ...
'myInt8Cal.mat'))

Функция автоматической настройки позволяет библиотеке cuDNN находить самые быстрые алгоритмы свертки.

'DataType' параметр определяет точность вычислений вывода в поддерживаемых слоях. При выполнении вывода в 32-разрядных поплавках используйте 'FP32'.

Создать coder.gpuConfig объект конфигурации для создания статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

Чтобы задать минимальную вычислительную способность для генерации кода, используйте ComputeCapability свойства объекта конфигурации кода графического процессора.

cfg.GpuConfig.ComputeCapability = '7.0';

Создайте объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его DeepLearningConfig имущества cfg объект конфигурации.

dlcfg = coder.DeepLearningConfig('cudnn');
dlcfg.AutoTuning = true;
dlcfg.DataType = 'int8';
dlcfg.CalibrationResultFile = 'myInt8Cal.mat';
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с помощью cuDNN (GPU Coder).

Процессор Intel ® CPU

Чтобы использовать библиотеку Intel Math Kernel Library для глубоких нейронных сетей (MKL-DNN) для процессоров Intel, установите 'targetlib' параметр для 'mkldnn'.

cnncodegen(net,'targetlib'...
,'mkldnn');

Создать coder.config объект конфигурации для создания статической библиотеки.

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

Создать coder.MklDNNConfig объект конфигурации глубокого обучения. Присвойте его DeepLearningConfig имущества cfg объект конфигурации.

dlcfg = coder.DeepLearningConfig...
('mkldnn');
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Дополнительные сведения см. в разделе Создание кода для сетей глубокого обучения с MKL-DNN.

Графические процессоры NVIDIA с помощью NVIDIA TensorRT™, высокопроизводительного оптимизатора выводов глубокого обучения и библиотеки времени выполнения

Установите 'targetlib' параметр для 'tensorrt'. Укажите свойства библиотеки TensorRT с помощью 'targetparams' параметр.

cnncodegen(net,'targetlib'...
,'tensorrt','ComputeCapability'...
,'7.0','targetparams' ...
,struct('DataType','INT8' ...
'DataPath','image_dataset'...
,'NumCalibrationBatches',50))

Создать coder.gpuConfig объект конфигурации для создания статической библиотеки.

cfg = coder.gpuConfig('lib');
cfg.TargetLang = 'C++';

cfg.GpuConfig.ComputeCapability = '7.0';

Создать coder.TensorRTConfig (Кодер графического процессора) объект конфигурации глубокого обучения. Укажите специфичные для целевой библиотеки свойства объекта конфигурации глубокого обучения. Присвойте его DeepLearningConfig имущества cfg объект конфигурации.

dlcfg = coder.DeepLearningConfig...
('cudnn');
dlcfg.DataType = 'int8';
dlcfg.DataPath = 'image_dataset';
dlcfg.NumCalibrationBatches = 50;
cfg.DeepLearningConfig = dlcfg;

arg = {ones(224,224,3,'single')};
codegen -args arg ...
-config cfg googlenet_predict

Дополнительные сведения см. в разделе Прогнозирование глубокого обучения с помощью NVIDIA TensorRT (GPU Coder).

Общие параметры

Создание кода без создания make-файла. Например,

cnncodegen(net,'targetlib' ...
,'mkldnn','codegenonly',1);

Чтобы создать исходный код без вызова команды make или кода объекта построения, используйте команду GenCodeOnly имущества coder.CodeConfig или coder.GPUCodeConfig объект. Например,

cfg = coder.codeConfig('lib');
cfg.GenCodeOnly = true;

Задание вычислительной способности графического процессора NVIDIA для компиляции. Аргумент принимает формат major#.minor#.

cnncodegen(net,'targetlib'...
,'cudnn','ComputeCapability','7.0');

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.ComputeCapability = '7.0';

Документация

cnncodegen

Синтаксис

Описание

Примеры

Создание кода C++ для предварительно обученной сети для работы на ARM-процессоре

Входные аргументы

`net` - Предварительно обученный объект сети глубокого обучения
вектор символов | строковый скаляр

`targetparams` - Параметры, специфичные для библиотеки
структура

Вопросы совместимости

Изменения в поддержке целевой библиотеки

См. также

Функции

Темы

Документация по кодеру MATLAB

Поддержка

Документация

cnncodegen

Синтаксис

Описание

Примеры

Создание кода C++ для предварительно обученной сети для работы на ARM-процессоре

Входные аргументы

net - Предварительно обученный объект сети глубокого обучения вектор символов | строковый скаляр

targetparams - Параметры, специфичные для библиотеки структура

Вопросы совместимости

Изменения в поддержке целевой библиотеки

См. также

Функции

Темы

Документация по кодеру MATLAB

Поддержка

`net` - Предварительно обученный объект сети глубокого обучения
вектор символов | строковый скаляр

`targetparams` - Параметры, специфичные для библиотеки
структура