Извлеките MFCC, регистрируйте энергию, дельту и дельту дельты звукового сигнала
задает опции с помощью одного или нескольких coeffs
= mfcc(___,Name,Value
)Name,Value
парные аргументы.
coeffs = mfcc(audioIn,fs,'LogEnergy','Replace')
возвращает mel частоту cepstral коэффициенты для входного аудиосигнала, произведенного в fs
Гц. Первый коэффициент в coeffs
вектор заменяется логарифмической энергетической ценностью.[
также возвращает дельту, дельту дельты и местоположение выборок, соответствующих каждому окну данных.coeffs
,delta
,deltaDelta
,loc
] = mfcc(___)
Коэффициенты кепстра частоты Мэла являются популярными функциями, извлеченными из речевых сигналов для использования в задачах распознавания. В модели фильтра источника речи, cepstral коэффициенты, как изучают, представляют фильтр (речевой тракт). Частотная характеристика речевого тракта относительно является гладкой, тогда как источник речевой речи может быть смоделирован, когда импульс обучается. В результате речевой тракт может быть оценен спектральным конвертом речевого сегмента.
Идея мотивации mel частоты cepstral коэффициенты состоит в том, чтобы сжать информацию о речевом тракте (сглаживавший спектр) в небольшое количество коэффициентов на основе понимания улитки уха. Несмотря на то, что нет никакого твердого стандарта для вычисления коэффициентов, основные шаги обрисованы в общих чертах схемой.
Значение по умолчанию mel набор фильтров линейно располагает первые 10 треугольных фильтров с интервалами и логарифмически располагает остающиеся фильтры с интервалами.
Информация, содержавшаяся в нулевой mel частоте cepstral коэффициент, часто увеличивается с или заменяется логарифмической энергией. Логарифмическое энергетическое вычисление зависит от входной области.
Если вход (audioIn) является сигналом временной области, логарифмическая энергия вычисляется с помощью следующего уравнения:
Если вход (audioIn) является сигналом частотного диапазона, логарифмическая энергия вычисляется с помощью следующего уравнения:
[1] Rabiner, Лоуренс Р. и Рональд В. Шафер. Теория и приложения цифровой речевой обработки. Верхний Сэддл-Ривер, NJ: Пирсон, 2010.
audioDelta
| audioFeatureExtractor
| Cepstral Feature Extractor | cepstralCoefficients
| detectSpeech