Обработка аудиоданных с использованием глубокого обучения

Расширьте рабочие процессы глубокого обучения с речевыми приложениями обработки и аудио

Примените глубокое обучение к аудио и речевым приложениям обработки при помощи Deep Learning Toolbox™ вместе с Audio Toolbox™.

Приложения

Audio LabelerЗадайте и визуализируйте метки основной истины

Функции

audioDatastoreDatastore для набора звуковых файлов
audioDataAugmenterУвеличьте аудиоданные
audioFeatureExtractorОптимальная экстракция функции аудио
vggishFeaturesИзвлеките функции VGGish
vggishНейронная сеть VGGish
yamnetНейронная сеть YAMNet
yamnetGraphГрафик онтологии YAMNet AudioSet
classifySoundКлассифицируйте звуки на звуковой сигнал

Темы

Введение в глубокое обучение для аудиоприложений (Audio Toolbox)

Изучите общие инструменты и рабочие процессы, чтобы применить глубокое обучение к аудиоприложениям.

Классифицируйте звук Используя глубокое обучение (Audio Toolbox)

Обучите, подтвердите и протестируйте простую долгую краткосрочную память (LSTM), чтобы классифицировать звуки.

Передача обучения с предварительно обученными аудио сетями (Audio Toolbox)

Используйте передачу обучения, чтобы переобучить YAMNet, предварительно обученную сверточную нейронную сеть (CNN), чтобы классифицировать новый набор звуковых сигналов.

Рекомендуемые примеры

Speech Command Recognition Code Generation on Raspberry Pi

Речевая генерация кода распознавания команды на Raspberry Pi

Разверните извлечение признаков и сверточную нейронную сеть (CNN) для речевого распознавания команды к Raspberry Pi™. Чтобы сгенерировать извлечение признаков и сетевой код, вы используете MATLAB Coder, Пакет Поддержки MATLAB для Оборудования Raspberry Pi и Библиотеку ARM® Compute. В этом примере сгенерированный код является исполняемым файлом на вашем Raspberry Pi, который вызван скриптом MATLAB, который отображает предсказанную речевую команду наряду с и слуховой спектрограммой сигнала. Взаимодействие между скриптом MATLAB и исполняемым файлом на вашем Raspberry Pi обработано с помощью пользовательского дейтаграммного протокола (UDP). Для получения дополнительной информации о предварительной обработке аудио и сетевом обучении, смотрите Распознание речевых команд с использованием глубокого обучения.