Извлечение MFCC, энергии регистрации, дельты и дельта-дельты звукового сигнала
указывает параметры, использующие один или несколько coeffs = mfcc(___,Name,Value)Name,Value аргументы пары.
coeffs = mfcc(audioIn,fs,'LogEnergy','Replace') возвращает частотные кепстральные коэффициенты для входного аудиосигнала, дискретизированного в fs Гц. Первый коэффициент в coeffs вектор заменяют на логарифмическое значение энергии.[ также возвращает дельту, дельту-дельту и местоположение выборок, соответствующих каждому окну данных.coeffs,delta,deltaDelta,loc] = mfcc(___)
Частотные коэффициенты кепстра являются популярными признаками, извлеченными из речевых сигналов для использования в задачах распознавания. В модели «источник-фильтр» речи кепстральные коэффициенты понимаются как представляющие фильтр (речевой тракт). Частотная характеристика голосового тракта является относительно гладкой, тогда как источник озвученной речи может быть смоделирован как импульсный поезд. В результате речевой тракт может быть оценен по спектральной огибающей речевого сегмента.
Мотивирующая идея кепстральных коэффициентов частоты заключается в сжатии информации о голосовом тракте (сглаженном спектре) в малое количество коэффициентов на основе понимания улитки. Хотя нет жёсткого стандарта для вычисления коэффициентов, основные шаги очерчены диаграммой.

Набор фильтров по умолчанию линейно размещает первые 10 треугольных фильтров, а остальные - логарифмически.

Информация, содержащаяся в кепстральном коэффициенте нулевой частоты, часто дополняется или заменяется логарифмической энергией. Расчет логарифмической энергии зависит от области ввода.
Если вход (audioIn) является сигналом временной области, логарифмическая энергия вычисляется с использованием следующего уравнения:
x2))
Если вход (audioIn) является сигналом частотной области, логарифмическая энергия вычисляется с использованием следующего уравнения:
FFTLength)
[1] Рабинер, Лоуренс Р. и Рональд В. Шефер. Теория и применение цифровой обработки речи. Река Верхнее Седло, Нью-Джерси: Пирсон, 2010.
[2] Панель слуховых инструментов. https://engineering.purdue.edu/~malcolm/interval/1998-010/AuditoryToolboxTechReport.pdf
audioDelta | audioFeatureExtractor | Экстрактор элементов Cepstral | cepstralCoefficients | detectSpeech