Эта модель обнаруживает голосовую активность, используя аудиосигнал частотного диапазона.
Обнаружение речевой активности часто используется как индикация необходимости дальнейшей обработки или анализа сигнала. Многие методы обработки и анализа требуют представления сигнала в частотном диапазоне. Для примера алгоритм обнаружения голосовой активности работает в частотный диапазон. Чтобы сохранить расчет, можно один раз преобразовать аудиосигнал в частотный диапазон, а затем передать частотный диапазон сигнал в нисходящий анализ и обработку.
Эта модель дополнительно буферизует сигнал так, чтобы VAD работал с наполовину перекрытыми системами координат. Перекрытие входных кадров к VAD увеличивает точность и разрешение во времени вероятности речи.
Audio Device Writer | Буфер | Delay | FFT | From Multimedia File | Time Scope | Voice Activity Detector | Window Function