Аудио Toolbox™ предоставляет функциональные возможности для разработки решений машинного и глубокого обучения для аудио, речи и акустических приложений, включая идентификацию динамиков, распознавание речевых команд, распознавание акустических сцен и многое другое.
Использовать audioDatastore для параллельного приема больших наборов аудиоданных и обработки файлов.
Используйте Audio Labeler для создания наборов аудиоданных путем аннотирования аудиозаписей вручную и автоматически.
Использовать audioDataAugmenter создание рандомизированных конвейеров встроенных или пользовательских методов обработки сигналов для увеличения и синтеза наборов аудиоданных.
Использовать audioFeatureExtractor извлечение комбинаций различных элементов при совместном использовании промежуточных вычислений.
Audio Toolbox также предоставляет доступ к API сторонних производителей для преобразования текста в речь и речи в текст, а также включает предварительно подготовленные модели VGGish и YAMNet, что позволяет выполнять обучение передаче, классификацию звуков и извлечение встраиваемых функций. Для использования предварительно подготовленных сетей требуется Toolbox™ глубокого обучения.