Квантуйте глубокую нейронную сеть к 8-битным масштабированным целочисленным типам данных
Используйте приложение Deep Network Quantizer, чтобы уменьшать требования к памяти глубокой нейронной сети путем квантования весов, смещений и активаций слоев свертки к 8-битным масштабированным целочисленным типам данных. Используя это приложение вы можете:
Визуализируйте динамические диапазоны слоев свертки в глубокой нейронной сети.
Выберите отдельные слоя сети, чтобы квантовать.
Задницы производительность квантованной сети.
Сгенерируйте код графического процессора, чтобы развернуть квантованную сеть с помощью GPU Coder.
Квантование нейронной сети требует графического процессора, Интерфейса GPU Coder™ для пакета поддержки Библиотек Глубокого обучения и пакета поддержки Библиотеки Квантования Модели Deep Learning Toolbox™. Используя графический процессор требует, чтобы CUDA® включил NVIDIA®, графический процессор с вычисляет возможность 6.1 или выше.
Командная строка MATLAB®: Введите deepNetworkQuantizer
.