exponenta event banner

Обнаружение голосовой активности в частотной области

Эта модель обнаруживает речевую активность с помощью звукового сигнала частотной области.

Обнаружение речевой активности часто используется в качестве указания на необходимость дальнейшей обработки или анализа сигнала. Многие технологии обработки и анализа требуют представления сигнала в частотной области. Например, алгоритм обнаружения речевой активности работает в частотной области. Чтобы сохранить вычисления, можно один раз преобразовать аудиосигнал в частотную область, а затем подать сигнал частотной области на анализ и обработку в нисходящем направлении.

Эта модель дополнительно буферизирует сигнал, так что VAD работает на полусопряженных кадрах. Наложение входных кадров на VAD увеличивает точность и разрешение во времени вероятности речи.

См. также

| | | | | | |