Применение глубокого обучения к приложениям для обработки звука и речи с помощью Deep Learning Toolbox™ совместно с Audio Toolbox™. Приложения для обработки сигналов см. в разделе Обработка сигналов с помощью глубокого обучения. Приложения для беспроводной связи см. в разделе Беспроводная связь с использованием глубокого обучения.
| Аудиомаркировщик | Определение и визуализация меток «земля-истина» |
ivectorSystem | Создание i-векторной системы |
crepe | Нейронная сеть CREPE |
crepePreprocess | Предварительная обработка аудио для сети глубокого обучения CREPE |
crepePostprocess | Постобработка выходных данных сети глубокого обучения CREPE |
pitchnn | Оценка шага с помощью нейронной сети глубокого обучения |
openl3 | OpenL3 нейронная сеть |
openl3Preprocess | Предварительная обработка звука для извлечения OpenL3 функций |
openl3Features | Извлечение OpenL3 элементов |
audioDatastore | Хранилище данных для сбора аудиофайлов |
audioDataAugmenter | Увеличение аудиоданных |
audioFeatureExtractor | Оптимизация извлечения звуковых функций |
vggishPreprocess | Предварительная обработка звука для извлечения функций VGGish |
vggishFeatures | Извлечение элементов VGGish |
vggish | Нейронная сеть VGGish |
yamnet | Нейронная сеть YAMNet |
yamnetPreprocess | Предварительная обработка аудио для классификации YAMNet |
yamnetGraph | График онтологии AudioSet компании YAMNet |
classifySound | Классификация звуков в звуковом сигнале |
Введение в глубокое обучение для аудиоприложений (Audio Toolbox)
Изучите общие инструменты и рабочие процессы для применения глубокого обучения к аудиоприложениям.
Классифицировать звук с помощью глубокого обучения (Audio Toolbox)
Обучение, проверка и тестирование простой долговременной памяти (LSTM) для классификации звуков.
Передача обучения с помощью предварительно обученных аудиосетей (панель инструментов для аудио)
Используйте transfer learning для переподготовки YAMNet, предварительно обученной сверточной нейронной сети (CNN), для классификации нового набора аудиосигналов.
Идентификация динамиков с использованием пользовательского уровня SincNet и глубокого обучения (панель инструментов Audio)
Выполните распознавание речи с помощью пользовательского уровня глубокого обучения, который реализует банк фильтров mel-scale.
Отказ от речи с использованием сетей глубокого обучения (набор аудиоуслуг)
Обучение модели глубокого обучения, которая удаляет реверберацию из речи.
Распознавание речевых команд в Simulink (панель звуковых инструментов)
Определите наличие речевых команд в звуке с помощью модели Simulink ®.