Примените глубокое обучение к аудио и речевым приложениям обработки при помощи Deep Learning Toolbox™ вместе с Audio Toolbox™. Для приложений обработки сигналов смотрите Обработку сигналов с использованием глубокого обучения. Для приложений в радиосвязях смотрите, что Радиосвязи Используют Глубокое обучение.
Audio Labeler | Задайте и визуализируйте метки основной истины |
Введение в глубокое обучение для аудиоприложений (Audio Toolbox)
Изучите общие инструменты и рабочие процессы, чтобы применить глубокое обучение к аудиоприложениям.
Классифицируйте звук Используя глубокое обучение (Audio Toolbox)
Обучите, подтвердите и протестируйте простую долгую краткосрочную память (LSTM), чтобы классифицировать звуки.
Передача обучения с предварительно обученными аудио сетями
Используйте передачу обучения, чтобы переобучить YAMNet, предварительно обученную сверточную нейронную сеть (CNN), чтобы классифицировать новый набор звуковых сигналов.
Идентификация динамика Используя пользовательский слой SincNet и глубокое обучение
Выполните распознавание речи с помощью пользовательского слоя глубокого обучения, который реализует набор фильтров mel-шкалы.
Речь Dereverberate Используя нейронные сети для глубокого обучения
Обучите модель глубокого обучения, которая удаляет реверберацию из речи.
Речевое распознавание команды в Simulink
Обнаружьте присутствие речевых команд в аудио с помощью Simulink® модель.
Разговорное распознавание цифры с рассеиванием вейвлета и глубоким обучением
В этом примере показано, как классифицировать разговорные цифры с помощью обоих методов машинного и глубокого обучения.
Исходное разделение приема Используя нейронные сети для глубокого обучения
В этом примере показано, как изолировать речевой сигнал использование нейронной сети для глубокого обучения.
Последовательный выбор признаков для функций аудио
Этот пример показывает, что типичный рабочий процесс для выбора признаков применился к задаче разговорного распознавания цифры.
Изучите фильтр перед акцентом Используя глубокое обучение
Используйте сверточную глубокую сеть, чтобы изучить фильтр перед акцентом для распознавания речи.