extract

Извлеките функции аудио

Описание

пример

features = extract(aFE,audioIn) возвращает массив, содержащий функции аудиовхода.

Примеры

свернуть все

Читайте в звуковом сигнале.

[audioIn,fs] = audioread("Counting-16-44p1-mono-15secs.wav");

Создайте audioFeatureExtractor извлекать центроид спектра Коры, эксцесс спектра Коры и pitch из звукового сигнала.

aFE = audioFeatureExtractor("SampleRate",fs, ...
    "SpectralDescriptorInput","barkSpectrum", ...
    "spectralCentroid",true, ...
    "spectralKurtosis",true, ...
    "pitch",true)
aFE = 
  audioFeatureExtractor with properties:

   Properties
                     Window: [1024x1 double]
              OverlapLength: 512
                 SampleRate: 44100
                  FFTLength: []
    SpectralDescriptorInput: 'barkSpectrum'

   Enabled Features
     spectralCentroid, spectralKurtosis, pitch

   Disabled Features
     linearSpectrum, melSpectrum, barkSpectrum, erbSpectrum, mfcc, mfccDelta
     mfccDeltaDelta, gtcc, gtccDelta, gtccDeltaDelta, spectralCrest, spectralDecrease
     spectralEntropy, spectralFlatness, spectralFlux, spectralRolloffPoint, spectralSkewness, spectralSlope
     spectralSpread, harmonicRatio


   To extract a feature, set the corresponding property to true.
   For example, obj.mfcc = true, adds mfcc to the list of enabled features.

Вызовите extract извлекать функции из звукового сигнала. Нормируйте функции на их среднее и стандартное отклонение.

features = extract(aFE,audioIn);
features = (features - mean(features,1))./std(features,[],1);

Стройте нормированные функции в зависимости от времени.

idx = info(aFE);
duration = size(audioIn,1)/fs;

subplot(2,1,1)
t = linspace(0,duration,size(audioIn,1));
plot(t,audioIn)

subplot(2,1,2)
t = linspace(0,duration,size(features,1));
plot(t,features(:,idx.spectralCentroid), ...
     t,features(:,idx.spectralKurtosis), ...
     t,features(:,idx.pitch));
legend("Spectral Centroid","Spectral Kurtosis", "Pitch")
xlabel("Time (s)")

Входные параметры

свернуть все

audioFeatureExtractor объект.

Введите аудио в виде вектор-столбца или матрицы независимых каналов (столбцы).

Типы данных: single | double

Выходные аргументы

свернуть все

Извлеченные функции аудио, возвращенные как L-by-M-by-N массив, где:

  • L Количество характеристических векторов (транзитные участки)

  • M Количество функций извлечено на аналитическое окно

  • N Количество каналов

Типы данных: single | double

Введенный в R2019b