Класс: dlhdl. ProcessorConfig
Пакет: dlhdl
Получение задержек и производительности на уровне уровня с помощью estimatePerformance метод
estimatePerformance( возвращает задержки уровня и производительность сети для объекта, указанного network) network аргумент.
возвращает таблицу, содержащую performance = estimatePerformance(network) network задержки и производительность уровня объекта.
Расчет производительности сети LogoNet и задержек уровня для hPC
ProcessorConfig объект.
Создание файла в текущей рабочей папке с именем getLogoNetwork.m. В файле введите:
function net = getLogoNetwork() if ~isfile('LogoNet.mat') url = 'https://www.mathworks.com/supportfiles/gpucoder/cnn_models/logo_detection/LogoNet.mat'; websave('LogoNet.mat',url); end data = load('LogoNet.mat'); net = data.convnet; end
Создать dlhdl.ProcessorConfig объект.
snet = getLogoNetwork; hPC = dlhdl.ProcessorConfig;
Чтобы получить задержки уровня и производительность для сети LogoNet, вызовите estimatePerformance способ.
hPC.estimatePerformance(snet)
3 Memory Regions created.
Deep Learning Processor Estimator Performance Results
LastFrameLatency(cycles) LastFrameLatency(seconds) FramesNum Total Latency Frames/s
------------- ------------- --------- --------- ---------
Network 39853460 0.19927 1 39853460 5.0
____conv_1 6825287 0.03413
____maxpool_1 3755088 0.01878
____conv_2 10440701 0.05220
____maxpool_2 1447840 0.00724
____conv_3 9393397 0.04697
____maxpool_3 1765856 0.00883
____conv_4 1770484 0.00885
____maxpool_4 28098 0.00014
____fc_1 2644884 0.01322
____fc_2 1692532 0.00846
____fc_3 89293 0.00045
* The clock frequency of the DL processor is: 200MHzПолучение оценки производительности для dlquantizer объект, установите dlhdl.ProcessorConfig объект KernelDataType тип данных int8 для модулей конвейера, fc и сумматора.