Обнаружение наличия речи в звуковом сигнале
Панель звуковых инструментов/измерения
Блок детектора речевой активности обнаруживает наличие речи в звуковом сигнале. Можно также использовать блок детектора речевой активности для вывода оценки дисперсии шума на частотный блок.
Типы данных |
|
Прямой проход |
|
Многомерные сигналы |
|
Сигналы переменного размера |
|
Обнаружение пересечения нулей |
|
Детектор речевой активности реализует алгоритм, описанный в [1].

Если домен входа указан как Timeвходной сигнал преобразуется в частотную область в соответствии с окном, затуханием окна (дБ) и параметрами длины БПФ. Если домен входа указан как Frequencyпредполагается, что вход является оконным дискретным временным преобразованием Фурье (DTFT) звукового сигнала. Затем сигнал преобразуется в область питания. Дисперсия шума оценивается согласно [2]. Задняя и предыдущая SNR оцениваются по формуле минимальной среднеквадратической ошибки (MMSE), описанной в [3]. В соответствии с [1] используется логарифмический тест отношения правдоподобия с использованием схемы зависания на основе скрытой модели Маркова (HMM).
[1] Сон, Джонгсео, Нам Су Ким и Вонён Сен. «Обнаружение голосовой активности на основе статистической модели». Обработка сигналов письма IEEE. Том 6, № 1, 1999.
[2] Мартин, Р. «Оценка спектральной плотности мощности шума на основе оптимального сглаживания и минимальной статистики». Транзакции IEEE по обработке речи и звука. Том 9, № 5, 2001, стр. 504-512.
[3] Ефрем, Я. и Д. Мала. «Улучшение речи с использованием устройства оценки минимальной среднеквадратической ошибки с короткими временными спектральными амплитудами». Транзакции IEEE для обработки акустики, речи и сигналов. т. 32, № 6, 1984, с. 1109-1121.