exponenta event banner

Поддержка нескольких рам

Deep Learning HDL Toolbox™ поддерживает режим нескольких кадров, который позволяет записывать несколько изображений в память с двойной скоростью передачи данных (DDR) и считывать несколько результатов одновременно. Чтобы повысить производительность развернутых сетей глубокого обучения, используйте режим нескольких кадров.

Входной формат DDR

Форматирование входных изображений в соответствии с форматом DDR ввода нескольких кадров требует:

  • Начальный адрес входных данных для DDR

  • Смещение DDR для одного кадра входного изображения

Эта информация автоматически генерируется compile способ. Дополнительные сведения о созданных смещениях адресов DDR см. в разделе Использование выходных данных компилятора для системной интеграции.

Можно также указать максимальное количество входных кадров в качестве необязательного аргумента в compile способ. Дополнительные сведения см. в разделе Создание смещений памяти DDR на основе количества входных кадров.

Выходной формат DDR

Получение результатов для нескольких входных изображений из области вывода DDR требует:

  • Начальный адрес области вывода DDR

  • Смещение DDR одного результата

Выходные результаты должны быть отформатированы таким образом, чтобы они были кратны размеру выходного элемента FC. Информация и форматирование автоматически генерируются compile способ. Дополнительные сведения о созданных смещениях адресов DDR см. в разделе Использование выходных данных компилятора для системной интеграции.

Ручное включение режима нескольких кадров

После развертывания сети глубокого обучения можно вручную включить режим нескольких кадров, записав количество кадров через сетевой порт конфигурации (NC). Для ручного перехода в режим нескольких кадров в командной строке MATLAB ® введите:

dnnfpga.hwutils.writeSignal(1, dnnfpga.hwutils.numTo8Hex(addrMap('nc_op_image_count')),15,hT);

Функция addrMap('nc_op_image_count') возвращает адрес регистра AXI для nc_op_image_count, 15 - количество изображений, и hT представляет dlhdl.Target класс, содержащий определение платы и определение интерфейса платы. Дополнительные сведения об адресах регистров AXI см. в разделе Карта регистров процессоров глубокого обучения.

См. также

| |

Связанные темы