Эта модель обнаруживает речевую активность с помощью звукового сигнала частотной области.
Обнаружение речевой активности часто используется в качестве указания на необходимость дальнейшей обработки или анализа сигнала. Многие технологии обработки и анализа требуют представления сигнала в частотной области. Например, алгоритм обнаружения речевой активности работает в частотной области. Чтобы сохранить вычисления, можно один раз преобразовать аудиосигнал в частотную область, а затем подать сигнал частотной области на анализ и обработку в нисходящем направлении.
Эта модель дополнительно буферизирует сигнал, так что VAD работает на полусопряженных кадрах. Наложение входных кадров на VAD увеличивает точность и разрешение во времени вероятности речи.

Устройство записи аудиоустройств | Буфер | Задержка | FFT | Из мультимедийного файла | Объем времени | Детектор речевой активности | Оконная функция