exponenta event banner

Обнаружение голосовой активности частотного диапазона

Эта модель обнаруживает голосовую активность, используя аудиосигнал частотного диапазона.

Обнаружение речевой активности часто используется как индикация необходимости дальнейшей обработки или анализа сигнала. Многие методы обработки и анализа требуют представления сигнала в частотном диапазоне. Для примера алгоритм обнаружения голосовой активности работает в частотный диапазон. Чтобы сохранить расчет, можно один раз преобразовать аудиосигнал в частотный диапазон, а затем передать частотный диапазон сигнал в нисходящий анализ и обработку.

Эта модель дополнительно буферизует сигнал так, чтобы VAD работал с наполовину перекрытыми системами координат. Перекрытие входных кадров к VAD увеличивает точность и разрешение во времени вероятности речи.

См. также

| | | | | | |