Генерация кода графического процессора для блоков из библиотеки глубоких нейронных сетей

С GPU Coder™ можно сгенерировать оптимизированный код для Simulink® модели, содержащие множество обученных нейронных сетей для глубокого обучения. Можно реализовать функциональность глубокого обучения в Simulink при помощи блоков MATLAB Function или при помощи блоков из библиотеки Deep Neural Networks. Библиотека блоков Deep Neural Networks включает:

Можно сконфигурировать генератор кода, чтобы использовать в своих интересах NVIDIA® CUDA® библиотека глубокой нейронной сети (cuDNN) и высокоэффективные библиотеки вывода TensorRT™ для NVIDIA графические процессоры. Сгенерированный код реализует глубокую сверточную нейронную сеть (CNN) при помощи архитектуры, слоев и параметров, которые вы задаете в сетевом объекте.

Пример: классифицируйте изображения при помощи GoogLeNet

GoogLeNet был обучен на более чем миллионе изображений и может классифицировать изображения в 1 000 категорий объектов (таких как клавиатура, кофейная кружка, карандаш и животные). Сеть берет изображение в качестве входа, и затем выводит метку для объекта в изображении с вероятностями для каждой из категорий объектов. В этом примере показано, как выполнить симуляцию и сгенерировать код CUDA для предварительно обученного googlenet глубокая сверточная нейронная сеть и классифицирует изображение. Предварительно обученные сети доступны как пакеты поддержки от Deep Learning Toolbox™.

  1. Загрузите предварительно обученную сеть GoogLeNet.

    net = googlenet;
    

  2. Объект net содержит DAGNetwork объект. Используйте analyzeNetwork функционируйте, чтобы отобразить интерактивную визуализацию сетевой архитектуры, обнаружить ошибки и проблемы в сети, и отобразить подробную информацию о слоях сети. Информация о слое включает размеры активаций слоя и настраиваемых параметров, общего количества настраиваемых параметров и размеров параметров состояния текущих слоев.

    analyzeNetwork(net);
    

    Analyze network app showing network analysis of GoogLeNet.

  3. Изображение, которое вы хотите классифицировать, должно иметь тот же размер как входной размер сети. Для GoogLeNet, размера imageInputLayer 224 224 3. Classes свойство выхода classificationLayer содержит имена классов, изученных сетью. Просмотрите 10 случайных имен классов из общего количества 1 000.

    classNames = net.Layers(end).Classes;
    numClasses = numel(classNames);
    disp(classNames(randperm(numClasses,10)))
    
        'speedboat'
        'window screen'
        'isopod'
        'wooden spoon'
        'lipstick'
        'drake'
        'hyena'
        'dumbbell'
        'strawberry'
        'custard apple'
    

Создайте модель GoogLeNet

  1. Создайте модель Simulink и вставьте блок Predict из библиотеки Deep Neural Networks.

  2. Добавьте блок Image From File из библиотеки Computer Vision Toolbox™ и установите File name параметр к peppers.png. Добавьте блок Resize от библиотеки Computer Vision Toolbox до модели. Установите параметр Specify блока Resize к Number of output rows and columns и введите [224 224] как значение для Number of output rows and columns. Изменить размер блок изменяет размер входного изображения к тому из входного слоя сети. Добавьте To Workspace в модель и поменяйте имя переменной на yPred.

    Simulink model containing blocks for classifying images using GoogLeNet.

  3. Откройте Block Parameters (subsystem) блока Predict. Выберите Network from MATLAB function для Network и googlenet для MATLAB function.

  4. Соедините эти блоки как показано в схеме. Сохраните модель как googlenetModel.slx.

    Simulink model showing connection between the blocks.

Сконфигурируйте модель для ускорения графического процессора

Параметры конфигурации модели определяют ускоряющий метод, используемый в процессе моделирования.

  1. Откройте диалоговое окно Configuration Parameters. Откройте панель Solver. Чтобы скомпилировать вашу модель для ускорения и сгенерировать код CUDA, сконфигурируйте модель, чтобы использовать решатель фиксированного шага. Эта таблица показывает настройку решателя для этого примера.

    ПараметрУстановкаЭффект на сгенерированном коде
    TypeFixed-stepОбеспечивает постоянный (фиксированный) размер шага, который требуется для генерации кода
    Solverdiscrete (no continuous states)Применяет метод интегрирования фиксированного шага для вычисления производной состояния модели
    Fixed-step sizeautoSimulink выбирает размер шага

    Snapshot of the configuration parameters dialog showing solver options for simulation.

  2. Выберите панель Simulation Target. Установите Language на C++.

  3. Выберите GPU acceleration. Опции, характерные для GPU Coder, теперь отображаются в панели Simulation Target > GPU Acceleration. В данном примере можно использовать значения по умолчанию этих параметров.

    GPU Acceleration pane on the configuration parameters dialog of the model.

  4. На панели Simulation Target, набор Target Library в группе Deep learning к cuDNN. Можно также выбрать TensorRT.

    Snapshot of the configuration parameters dialog showing deep learning options for simulation acceleration.

  5. Нажмите OK, чтобы сохранить и закрыть диалоговое окно Configuration Parameters.

    Можно использовать set_param сконфигурировать программно параметр модели в командном окне MATLAB.

    set_param('googlenetModel','GPUAcceleration','on');
    

Создайте графический процессор ускоренная модель

  1. Чтобы создать и симулировать графический процессор ускоренная модель, выберите Run на вкладке Simulation или используйте команду:

    out = sim('googlenetModel');
    

    Программное обеспечение сначала проверяет, чтобы видеть, был ли CUDA/C ++ код ранее скомпилирован для вашей модели. Если код был создан ранее, программное обеспечение запускает модель. Если код не был ранее создан, программное обеспечение сначала генерирует и компилирует CUDA/C ++ код, и затем запускает модель. Инструмент генерации кода помещает сгенерированный код в подпапку рабочей папки под названием slprj/_slprj/googlenetModel.

  2. Отобразите лучшие пять предсказанных меток и их связанные вероятности как гистограмма. Поскольку сеть классифицирует изображения в такое количество категорий объектов, и много категорий подобны, распространено рассмотреть лучшие пять точности при оценке сетей. Сеть классифицирует изображение как болгарский перец с высокой вероятностью.

    im = imread('peppers.png');
    predict_scores = out.yPred.Data(:,:,1);
    [scores,indx] = sort(predict_scores,'descend');
    topScores = scores(1:5);
    classNamesTop = classNames(indx(1:5))
    
    h = figure;
    h.Position(3) = 2*h.Position(3);
    ax1 = subplot(1,2,1);
    ax2 = subplot(1,2,2);
    
    image(ax1,im);
    barh(ax2,topScores)
    xlabel(ax2,'Probability')
    yticklabels(ax2,classNamesTop(5:-1:1))
    ax2.YAxisLocation = 'right';
    sgtitle('Top 5 predictions using GoogLeNet')
    

Сконфигурируйте модель для генерации кода

Параметры конфигурации модели предоставляют много возможностей для генерации кода и процесса сборки.

  1. В диалоговом окне Configuration Parameters выберите панель Code Generation. Установите System target file на grt.tlc.

    Можно также использовать Embedded Coder® конечный файл ert.tlc.

  2. Установите Language на C++.

  3. Выберите Generate GPU code.

  4. Выберите Generate code only.

  5. Выберите Toolchain. Для Linux® платформы, выберите NVIDIA CUDA | gmake (64-bit Linux). Для Windows® системы, выберите NVIDIA CUDA (w/Microsoft Visual C++ 20XX) | nmake (64-bit windows).

  6. На панели Code Generation > Report выберите Create code generation report и Open report automatically.

  7. На панели Code Generation > Interface, набор Target Library в группе Deep learning к cuDNN. Можно также выбрать TensorRT.

  8. Опции, характерные для GPU Coder, находятся в панели Code Generation > GPU Code. В данном примере можно использовать значения по умолчанию специфичных для графического процессора параметров в панели Code Generation > GPU Code.

    GPU Code pane on the configuration parameters dialog of the model.

  9. Нажмите OK, чтобы сохранить и закрыть диалоговое окно Configuration Parameters.

    Можно также использовать set_param сконфигурировать программно параметр модели в командном окне MATLAB.

    set_param('googlenetModel','GenerateGPUCode','CUDA');
    

Сгенерируйте код CUDA для модели

  1. В Редакторе Simulink откройте приложение Simulink Coder.

  2. Сгенерируйте код.

Сообщения появляются в Средстве просмотра Диагностики. Генератор кода производит исходные и заголовочные файлы CUDA и отчет генерации кода HTML. Генератор кода помещает файлы в папку сборки, подпапку под названием googlenetModel_grt_rtw под вашей текущей рабочей папкой.

Ограничения

  • Генерация кода для нейронной сети для глубокого обучения с пользовательским слоем не поддерживается в Simulink.

  • Генерация кода графического процессора для MATLAB Function блокируется в Stateflow® графики не поддерживаются.

  • Генератор кода не поддерживает все типы данных с языка MATLAB. Для поддерживаемых типов данных обратитесь к документации блока.

  • Для развертывания сгенерированного кода рекомендуется использовать опцию Generate an example main program, чтобы сгенерировать ert_main.cu модуль. Эта опция требует лицензии Embedded Coder.

    Можно также использовать rt_cppclass_main.cpp статический основной модуль обеспечивается MathWorks®. Однако статический основной файл должен быть изменен таким образом, что конструктор класса моделей указывает на объект глубокого обучения. Например,

    static googlenetModelModelClass::DeepLearning_googlenetModel_T
      googlenetModel_DeepLearning;
    static googlenetModelModelClass googlenetModel_Obj{ &googlenetModel_DeepLearning};
    

Смотрите также

Функции

Похожие темы