Применить глубокое обучение к приложениям обработки звука и речи при помощи Deep Learning Toolbox™ совместно с Audio Toolbox™. Для приложений обработки сигналов см. Обработку сигналов с использованием глубокого обучения. Для приложений в беспроводной связи смотрите Беспроводные коммуникации с использованием глубокого обучения.
Audio Labeler | Определите и визуализируйте метки основной истины |
ivectorSystem | Создайте i-векторную систему |
crepe | Нейронная сеть CREPE |
crepePreprocess | Предварительная обработка аудио для нейронной сети для глубокого обучения CREPE |
crepePostprocess | Постпроцессный выход нейронной сети для глубокого обучения CREPE |
pitchnn | Оценка тангажа с глубокой нейронной сетью |
openl3 | OpenL3 нейронную сеть |
openl3Preprocess | Предварительная обработка аудио для OpenL3 редукции данных |
openl3Features | Извлечение OpenL3 функций |
audioDatastore | Datastore для набора аудио файлов |
audioDataAugmenter | Увеличение звуковых данных |
audioFeatureExtractor | Оптимизация аудио редукции данных |
vggishPreprocess | Предварительная обработка аудио для редукции данных VGGish |
vggishFeatures | Извлечение функций VGGish |
vggish | Нейронная сеть VGGish |
yamnet | Нейронная сеть YAMNet |
yamnetPreprocess | Предварительная обработка аудио для классификации YAMNet |
yamnetGraph | Графиков онтологии YAMNet AudioSet |
classifySound | Классификация звуков в аудиосигнале |
Введение в глубокое обучение для аудио приложений (Audio Toolbox)
Изучение общих инструментов и рабочих процессов для применения глубокого обучения к аудио приложениям.
Классификация звука с помощью глубокого обучения (Audio Toolbox)
Обучите, проверьте и протестируйте простую долгую краткосрочную память (LSTM) для классификации звуков.
Передача обучения с предварительно обученными аудиосетями (Audio Toolbox)
Используйте передачу обучения для переобучения YAMNet, предварительно обученной сверточной нейронной сети (CNN), чтобы классифицировать новый набор аудиосигналов.
Идентификация динамика с использованием пользовательского слоя SincNet и глубокого обучения (Audio Toolbox)
Выполните распознавание речи с помощью пользовательского слоя глубокого обучения, который реализует mel-масштабную группу фильтров.
Дереверберация речи с использованием Нейронных сетей для глубокого обучения (Audio Toolbox)
Обучите модель глубокого обучения, которая удаляет реверберацию из речи.
Распознавание речевых команд в Simulink (Audio Toolbox)
Обнаружение наличия речевых команд в аудио с помощью Simulink® модель.