exponenta event banner

estimatePerformance

Класс: dlhdl. ProcessorConfig
Пакет: dlhdl

Получение задержек и производительности на уровне уровня с помощью estimatePerformance метод

Описание

estimatePerformance(network) возвращает задержки уровня и производительность сети для объекта, указанного network аргумент.

performance = estimatePerformance(network) возвращает таблицу, содержащую network задержки и производительность уровня объекта.

Примеры

Оценка производительности сети LogoNet

Расчет производительности сети LogoNet и задержек уровня для hPC ProcessorConfig объект.

Создание файла в текущей рабочей папке с именем getLogoNetwork.m. В файле введите:

function net = getLogoNetwork()
 if ~isfile('LogoNet.mat')
        url = 'https://www.mathworks.com/supportfiles/gpucoder/cnn_models/logo_detection/LogoNet.mat';
        websave('LogoNet.mat',url);
    end
    data = load('LogoNet.mat');
    net  = data.convnet;
end

Создать dlhdl.ProcessorConfig объект.

snet = getLogoNetwork;
hPC = dlhdl.ProcessorConfig;

Чтобы получить задержки уровня и производительность для сети LogoNet, вызовите estimatePerformance способ.

hPC.estimatePerformance(snet)
3 Memory Regions created.



              Deep Learning Processor Estimator Performance Results

                   LastFrameLatency(cycles)   LastFrameLatency(seconds)       FramesNum      Total Latency     Frames/s
                         -------------             -------------              ---------        ---------       ---------
Network                   39853460                  0.19927                       1           39853460              5.0
    ____conv_1             6825287                  0.03413 
    ____maxpool_1          3755088                  0.01878 
    ____conv_2            10440701                  0.05220 
    ____maxpool_2          1447840                  0.00724 
    ____conv_3             9393397                  0.04697 
    ____maxpool_3          1765856                  0.00883 
    ____conv_4             1770484                  0.00885 
    ____maxpool_4            28098                  0.00014 
    ____fc_1               2644884                  0.01322 
    ____fc_2               1692532                  0.00846 
    ____fc_3                 89293                  0.00045 
 * The clock frequency of the DL processor is: 200MHz

Входные аргументы

развернуть все

Имя сетевого объекта для оценки производительности.

Пример: estimatePerformance(snet)

Выходные аргументы

развернуть все

Производительность сетевого объекта для ProcessorConfig объект, возвращенный в виде таблицы.

Совет

Получение оценки производительности для dlquantizer объект, установите dlhdl.ProcessorConfig объект KernelDataType тип данных int8 для модулей конвейера, fc и сумматора.

Представлен в R2021a