Установка необходимых как условие продуктов

Чтобы использовать GPU Coder™ в генерации кода CUDA® C/C ++, необходимо установить следующие продукты:

Продукты Mathworks

  • MATLAB® (требуется).

  • MATLAB Coder™ (требуется).

  • Parallel Computing Toolbox™ (требуется).

  • Deep Learning Toolbox™ (требуемый для глубокого обучения).

  • Интерфейс GPU Coder для Библиотек Глубокого обучения (требуемый для глубокого обучения).

  • Image Processing Toolbox™ (рекомендован).

  • Computer Vision Toolbox™ (рекомендован).

  • Embedded Coder® (рекомендован).

  • Simulink® (рекомендован).

Примечание

Если MATLAB установлен на пути, который содержит не 7-битные символы ASCII, такие как японские символы, MATLAB Coder не работает, потому что это не может определить местоположение библиотечных функций генерации кода.

Для получения инструкций по установке продуктов MathWorks® см. документацию по установке MATLAB для своей платформы. Если вы установили MATLAB и хотите проверять, который установлены другие Продукты Mathworks, введите ver в окне Команды MATLAB.

Сторонние продукты

Генерация кода графического процессора из MATLAB

  • NVIDIA®, с которым графический процессор включил для CUDA, вычисляет возможность 3.2, или выше (Мой графический процессор поддержан?).

  • Инструментарий CUDA и драйвер. Рекомендуется выбрать опции стандартной установки, который включает nvcc компилятор, cuFFT, cuBLAS, cuSOLVER, Толкайте библиотеки и другие инструменты. GPU Coder был протестирован с инструментарием CUDA v10.1 (Получите инструментарий CUDA).

  • Компилятор C/C++:

    Linux®

    Windows®

    GCC компилятор C/C++ 6.3.x

    Microsoft® Visual Studio® 2013

    Microsoft Visual Studio 2015

    Microsoft Visual Studio 2017

    Microsoft Visual Studio 2019

    Примечание

    • На Windows пробел или специальный символ в пути к инструментам, компиляторам и библиотекам могут создать проблемы во время процесса сборки. Необходимо установить стороннее программное обеспечение в местоположениях, которое не содержит пробелы или изменяет настройки Windows, чтобы включить создание кратких названий для файлов, папок и путей. Для получения дополнительной информации смотрите Используя решение для кратких названий Windows в MATLAB Answers.

    • nvcc NVIDIA компилятор использует тесную интеграцию со средой разработки хоста, включая компилятор хоста и библиотеки времени выполнения. Рекомендуется, чтобы вы следовали документации инструментария CUDA для получения дальнейшей информации относительно компилятора, библиотек и других конкретных требований платформы.

    • nvcc компилятор поддерживает несколько версий GCC, и поэтому можно сгенерировать код CUDA с другими версиями GCC. Однако могут быть проблемы совместимости при выполнении сгенерированного кода из MATLAB как библиотеки времени выполнения C/C++, которые включены с установкой MATLAB, скомпилированы для GCC 6.3.

    • Анализировать Профили Выполнения рабочего процесса Сгенерированного кода зависят от nvprof инструмент от NVIDIA. В инструментарии CUDA v10.1, NVIDIA ограничивает доступ к счетчикам производительности только пользователям администратора. Чтобы позволить счетчикам производительности графического процессора использоваться всеми пользователями, см. инструкции, предоставленные в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.

    • GPU Coder не поддерживает генерацию код CUDA при помощи версии 8 инструментария CUDA.

Генерация кода для нейронных сетей для глубокого обучения

Требования генерации кода для нейронных сетей для глубокого обучения зависят от платформы, для которой вы предназначаетесь.

 NVIDIA ГРАФИЧЕСКИЕ ПРОЦЕССОРЫARM® Mali графический процессор
Требования к аппаратным средствам

CUDA включил графический процессор с, вычисляют возможность 3.2 или выше.

Библиотеки Targeting NVIDIA TensorRT™ с INT8 точность требует, чтобы графический процессор CUDA с минимумом вычислил возможность 6,1.

Библиотеки Targeting NVIDIA TensorRT с FP16 точность требует, чтобы графический процессор CUDA с минимумом вычислил возможность 7,0.

ARM графический процессор Мали.
Библиотеки программного обеспечения

Библиотека CUDA Deep Neural Network (cuDNN) v7 или выше.

NVIDIA TensorRT – высокоэффективный оптимизатор вывода глубокого обучения и библиотека времени выполнения, v5 или выше.

ARM Вычисляет Библиотеку для компьютерного зрения и машинного обучения, v19.02. Эта библиотека должна быть установлена на целевом компьютере ARM.

Не пользуйтесь предварительно созданной библиотекой, потому что это может быть несовместимо с компилятором на оборудовании ARM. Вместо этого создайте библиотеку из исходного кода. Создайте библиотеку или по вашей хост-машине или по непосредственно по целевому компьютеру. См. инструкции для создания библиотеки по GitHub®. Можно также найти информацию о создании библиотеки для центральных процессоров в этом сообщении на ответах MATLAB.

При создании Вычислить Библиотеки включите поддержку OpenCL в опциях сборки. Смотрите, что ARM Вычисляет документацию Библиотеки для инструкций.

Библиотека OpenCL (v1.2 или выше) на целевом компьютере ARM. Смотрите, что ARM Вычисляет документацию Библиотеки для требований версии.

После того, как сборка завершена, переименуйте build папка, содержащая библиотеки как lib. Кроме того, скопируйте библиотеки OpenCL, существующие в build/opencl-1.2-stubs папка в lib папка. Эти шаги требуются так, чтобы сгенерированный make-файл мог определить местоположение библиотек при создании сгенерированного кода на целевом компьютере.

Поддержка операционной системы

Windows и Linux.

Windows и Linux.

Другой

Библиотека Компьютерного зрения С открытым исходным кодом (OpenCV), v3.1.0 требуется для примеров глубокого обучения.

Примечание: примеры требуют отдельный, освобождает такой как, opencv_core.lib и opencv_video.lib. OpenCV библиотека, которая поставляется с Computer Vision Toolbox, не имеет всех необходимых библиотек, и инсталлятор OpenCV не устанавливает их. Поэтому необходимо загрузить OpenCV источник и сборка библиотеки.

Для получения дополнительной информации обратитесь к OpenCV документация.

Библиотека Компьютерного зрения С открытым исходным кодом (OpenCV), v2.4.9 требуется на целевом компьютере для примеров глубокого обучения.

Смотрите также

| | | |

Похожие темы