Audio Toolbox™ обеспечивает функциональность, чтобы разработать решения для машинного и глубокого обучения для аудио, речи и акустических приложений включая идентификацию динамика, речевое распознавание команды, акустическое распознавание сцены, и многое другое.
Используйте audioDatastore
поглощать большие наборы аудиоданных и файлы процесса параллельно.
Используйте Audio Labeler, чтобы создать наборы аудиоданных путем аннотирования аудиозаписей вручную и автоматически.
Используйте audioDataAugmenter
создать рандомизированные конвейеры встроенных или пользовательских методов обработки сигналов для увеличения и синтезирования наборов аудиоданных.
Используйте audioFeatureExtractor
извлекать комбинации различных функций при совместном использовании промежуточных расчетов.
Audio Toolbox также обеспечивает доступ к сторонним API для текста к речи и речи в тексте, и это включает предварительно обученные модели VGGish и YAMNet так, чтобы можно было использовать обучение с переносом, классифицировать звуки и извлечь вложения функции. Используя предварительно обученные сети требует Deep Learning Toolbox™.