Audio Toolbox™ предоставляет примеры для распознавания малого словаря и синтеза звука. Для выполнения общего преобразования текста в речь и речи в текст Audio Toolbox предоставляет интерфейсы к популярным сторонним API. Поддерживаемые API включают Google® Речь, IBM® Речь Ватсона и Microsoft® Лазурная речь. Чтобы использовать эту функциональность, необходимо загрузить расширенную функциональность Audio Toolbox для text2speech и speech2text из File Exchange.
После установки функциональности «речь-текст» можно графически взаимодействовать с ней в приложении Audio Labeler, чтобы быстро пометить области речи.
Audio Labeler | Определите и визуализируйте метки основной истины |
Маркируйте аудио с помощью Audio Labeler
Интерактивно определите и визуализируйте метки основной истины для наборов данных аудиоданных.