Извлеките MFCC, регистрируйте энергию, дельту и дельту дельты звукового сигнала
задает опции с помощью одного или нескольких coeffs = mfcc(___,Name,Value)Name,Value парные аргументы.
coeffs = mfcc(audioIn,fs,'LogEnergy','Replace') возвращает mel частоту cepstral коэффициенты для входного аудиосигнала, произведенного в fs Гц. Первый коэффициент в coeffs вектор заменяется логарифмической энергетической ценностью.[ также возвращает дельту, дельту дельты и местоположение выборок, соответствующих каждому окну данных.coeffs,delta,deltaDelta,loc] = mfcc(___)
Коэффициенты кепстра частоты Мэла являются популярными функциями, извлеченными из речевых сигналов для использования в задачах распознавания. В модели фильтра источника речи, cepstral коэффициенты, как изучают, представляют фильтр (речевой тракт). Частотная характеристика речевого тракта относительно является гладкой, тогда как источник речевой речи может быть смоделирован, когда импульс обучается. В результате речевой тракт может быть оценен спектральным конвертом речевого сегмента.
Идея мотивации mel частоты cepstral коэффициенты состоит в том, чтобы сжать информацию о речевом тракте (сглаживавший спектр) в небольшое количество коэффициентов на основе понимания улитки уха. Несмотря на то, что нет никакого твердого стандарта для вычисления коэффициентов, основные шаги обрисованы в общих чертах схемой.

Значение по умолчанию mel набор фильтров линейно располагает первые 10 треугольных фильтров с интервалами и логарифмически располагает остающиеся фильтры с интервалами.

Информация, содержавшаяся в нулевой mel частоте cepstral коэффициент, часто увеличивается с или заменяется логарифмической энергией. Логарифмическое энергетическое вычисление зависит от входной области.
Если вход (audioIn) является сигналом временной области, логарифмическая энергия вычисляется с помощью следующего уравнения:
Если вход (audioIn) является сигналом частотного диапазона, логарифмическая энергия вычисляется с помощью следующего уравнения:
[1] Rabiner, Лоуренс Р. и Рональд В. Шафер. Теория и приложения цифровой речевой обработки. Верхний Сэддл-Ривер, NJ: Пирсон, 2010.
Cepstral Feature Extractor | audioFeatureExtractor | audioDelta | cepstralCoefficients | detectSpeech