exponenta event banner

извлечение

Извлечение функций звука

Описание

пример

features = extract(aFE,audioIn) возвращает массив, содержащий элементы звукового ввода.

Примеры

свернуть все

Считывание звукового сигнала.

[audioIn,fs] = audioread("Counting-16-44p1-mono-15secs.wav");

Создание audioFeatureExtractor для извлечения центроида спектра Барка, куртоза спектра Барка и pitch звукового сигнала.

aFE = audioFeatureExtractor("SampleRate",fs, ...
    "SpectralDescriptorInput","barkSpectrum", ...
    "spectralCentroid",true, ...
    "spectralKurtosis",true, ...
    "pitch",true)
aFE = 
  audioFeatureExtractor with properties:

   Properties
                     Window: [1024x1 double]
              OverlapLength: 512
                 SampleRate: 44100
                  FFTLength: []
    SpectralDescriptorInput: 'barkSpectrum'

   Enabled Features
     spectralCentroid, spectralKurtosis, pitch

   Disabled Features
     linearSpectrum, melSpectrum, barkSpectrum, erbSpectrum, mfcc, mfccDelta
     mfccDeltaDelta, gtcc, gtccDelta, gtccDeltaDelta, spectralCrest, spectralDecrease
     spectralEntropy, spectralFlatness, spectralFlux, spectralRolloffPoint, spectralSkewness, spectralSlope
     spectralSpread, harmonicRatio


   To extract a feature, set the corresponding property to true.
   For example, obj.mfcc = true, adds mfcc to the list of enabled features.

Звонить extract для извлечения функций из звукового сигнала. Нормализуйте элементы по их среднему и стандартному отклонению.

features = extract(aFE,audioIn);
features = (features - mean(features,1))./std(features,[],1);

Постройте график нормированных элементов с течением времени.

idx = info(aFE);
duration = size(audioIn,1)/fs;

subplot(2,1,1)
t = linspace(0,duration,size(audioIn,1));
plot(t,audioIn)

subplot(2,1,2)
t = linspace(0,duration,size(features,1));
plot(t,features(:,idx.spectralCentroid), ...
     t,features(:,idx.spectralKurtosis), ...
     t,features(:,idx.pitch));
legend("Spectral Centroid","Spectral Kurtosis", "Pitch")
xlabel("Time (s)")

Figure contains 2 axes. Axes 1 contains an object of type line. Axes 2 contains 3 objects of type line. These objects represent Spectral Centroid, Spectral Kurtosis, Pitch.

Входные аргументы

свернуть все

audioFeatureExtractor объект.

Входной звук, определяемый как вектор столбца или матрица независимых каналов (столбцов).

Типы данных: single | double

Выходные аргументы

свернуть все

Извлеченные звуковые функции, возвращенные в виде массива L-by-M-by-N, где:

  • L -- количество векторов функций (транзитных участков)

  • M -- Количество элементов, извлеченных в окне анализа

  • N -- Количество каналов

Типы данных: single | double

Представлен в R2019b