Обнаружьте присутствие речи в звуковом сигнале
Audio Toolbox / Измерения
Блок Voice Activity Detector обнаруживает присутствие речи в звуковом сигнале. Можно также использовать блок Voice Activity Detector, чтобы вывести оценку шумового отклонения на интервал частоты.
Типы данных |
|
Прямое сквозное соединение |
|
Многомерные сигналы |
|
Сигналы переменного размера |
|
Обнаружение пересечения нулем |
|
Voice Activity Detector реализует алгоритм, описанный в [1].
Если Domain of the input задан как Time
, входной сигнал является оконным и затем конвертированным к частотному диапазону согласно Window, Sidelobe attenuation of the window (dB) и параметрам FFT length. Если Domain of the input задан как Frequency
, вход принят, чтобы быть оконным преобразованием Фурье дискретного времени (DTFT) звукового сигнала. Сигнал затем преобразован в домен питания. Шумовое отклонение оценивается согласно [2]. Следующий и предшествующий ОСШ оценивается согласно формуле Минимальной среднеквадратичной погрешности (MMSE), описанной в [3]. Логарифмический тест отношения правдоподобия со Скрытой моделью Маркова (HMM) - базирующаяся схема похмелья используется, согласно [1].
[1] Зон, Jongseo., Нэм Су Ким и Вонюн Сун. "Статистическое основанное на модели речевое обнаружение действия". Обработка сигналов обозначает буквами IEEE. Издание 6, № 1, 1999.
[2] Мартин, R. "Оценка Спектральной плотности мощности шума На основе Оптимального Сглаживания и Минимальной Статистики". Транзакции IEEE о Речи и Обработке аудиоданных. Издание 9, № 5, 2001, стр 504–512.
[3] Эфраим, Y. и Д. Мала. "Речевое Улучшение Используя Минимальное Короткое время Среднеквадратичной погрешности Спектральное Амплитудное Средство оценки". Транзакции IEEE на Акустике, Речи и Обработке сигналов. Издание 32, № 6, 1984, стр 1109–1121.