spectralSkewness

Спектральная скошенность для звуковых сигналов и слуховых спектрограмм

Синтаксис

skewness = spectralSkewness(x,f)
skewness = spectralSkewness(x,f,Name,Value)
[skewness,spread,centroid] = spectralSkewness(___)

Описание

пример

skewness = spectralSkewness(x,f) возвращает спектральную скошенность сигнала, x, в зависимости от времени. То, как функция интерпретирует x, зависит от формы f.

пример

skewness = spectralSkewness(x,f,Name,Value) задает опции с помощью одного или нескольких аргументов пары Name,Value.

[skewness,spread,centroid] = spectralSkewness(___) возвращает спектральное распространение и спектральный центроид.

Примеры

свернуть все

Читайте в звуковом файле, вычислите скошенность с помощью параметров по умолчанию, и затем постройте результаты.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
skewness = spectralSkewness(audioIn,fs);

t = linspace(0,size(audioIn,1)/fs,size(skewness,1));
plot(t,skewness)
xlabel('Time (s)')
ylabel('Skewness')

Читайте в звуковом файле и затем вычислите mel спектрограмму с помощью функции melSpectrogram. Вычислите скошенность mel спектрограммы в зависимости от времени. Постройте график результатов.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

[s,cf,t] = melSpectrogram(audioIn,fs);

skewness = spectralSkewness(s,cf);

plot(t,skewness)
xlabel('Time (s)')
ylabel('Skewness')

Читайте в звуковом файле.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

Вычислите скошенность спектра мощности в зависимости от времени. Вычислите скошенность для Окон Хэмминга на 50 мс данных с перекрытием на 25 мс. Используйте диапазон от 62,5 Гц до fs/2 для вычисления скошенности. Постройте график результатов.

skewness = spectralSkewness(audioIn,fs, ...
                    'Window',hamming(round(0.05*fs)), ...
                    'OverlapLength',round(0.025*fs), ...
                    'Range',[62.5,fs/2]);

t = linspace(0,size(audioIn,1)/fs,size(skewness,1));
plot(t,skewness)
xlabel('Time (s)')
ylabel('Skewness')

Создайте объект dsp.AudioFileReader читать в покадровых аудиоданных. Создайте dsp.SignalSink, чтобы регистрировать спектральное вычисление скошенности.

fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav');
logger = dsp.SignalSink;

В цикле аудиопотока:

  1. Читайте в кадре аудиоданных.

  2. Вычислите спектральную скошенность для кадра аудио.

  3. Регистрируйте спектральную скошенность для более позднего графического вывода.

Чтобы вычислить спектральную скошенность только для данного входного кадра, задайте окно с тем же количеством выборок как вход и обнулите длину перекрытия. Постройте записанные данные.

win = hamming(fileReader.SamplesPerFrame);
while ~isDone(fileReader)
    audioIn = fileReader();
    skewness = spectralSkewness(audioIn,fileReader.SampleRate, ...
                               'Window',win, ...
                               'OverlapLength',0);
    logger(skewness)
end

plot(logger.Buffer)
ylabel('Skewness')

Используйте dsp.AsyncBuffer если

  • Вход к вашему циклу аудиопотока имеет переменные выборки на кадр.

  • Вход к вашему циклу аудиопотока имеет противоречивые выборки на кадр с аналитическим окном spectralSkewness.

  • Вы хотите вычислить спектральную скошенность для перекрытых данных.

Создайте объект dsp.AsyncBuffer, сбросьте регистратор и выпустите средство чтения файлов.

buff = dsp.AsyncBuffer;
reset(logger)
release(fileReader)

Укажите, что спектральная скошенность вычисляется для кадров на 50 мс с перекрытием на 25 мс.

fs = fileReader.SampleRate;

samplesPerFrame = round(fs*0.05);
samplesOverlap = round(fs*0.025);

samplesPerHop = samplesPerFrame - samplesOverlap;

win = hamming(samplesPerFrame);

while ~isDone(fileReader)
    audioIn = fileReader();
    write(buff,audioIn);

    while buff.NumUnreadSamples >= samplesPerHop
        audioBuffered = read(buff,samplesPerFrame,samplesOverlap);

        skewness = spectralSkewness(audioBuffered,fs, ...
                                   'Window',win, ...
                                   'OverlapLength',0);
        logger(skewness)
    end

end
release(fileReader)

Постройте записанные данные.

plot(logger.Buffer)
ylabel('Skewness')

Входные параметры

свернуть все

Входной сигнал, заданный как вектор, матрица или трехмерный массив. То, как функция интерпретирует x, зависит от формы f.

Типы данных: single | double

Частота дискретизации или вектор частоты в Гц, заданном как скаляр или вектор, соответственно. То, как функция интерпретирует x, зависит от формы f:

  • Если f является скаляром, x интерпретирован как сигнал временного интервала, и f интерпретирован как частота дискретизации. В этом случае x должен быть вектором действительных чисел или матрицей. Если x задан как матрица, столбцы интерпретированы, когда человек образовывает канал.

  • Если f является вектором, x интерпретирован как сигнал частотного диапазона, и f интерпретирован как частоты, в Гц, соответствуя строкам x. В этом случае x должен быть действительный L-by-M-by-N массив, где L является количеством спектральных значений на данных частотах f, M является количеством отдельных спектров, и N является количеством каналов.

  • Количество строк x, L, должно быть равно числу элементов f.

Типы данных: single | double

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Window',hamming(256)

Примечание

Следующие аргументы пары "имя-значение" применяются, если x является сигналом временного интервала. Если x является сигналом частотного диапазона, аргументы пары "имя-значение" проигнорированы.

Окно применяется во временном интервале, заданном как пара, разделенная запятой, состоящая из 'Window' и вектора действительных чисел. Число элементов в векторе должно быть в области значений [1, size(x,1)]. Число элементов в векторе должно также быть больше, чем OverlapLength.

Типы данных: single | double

Количество выборок перекрывается между смежными окнами, заданными как пара, разделенная запятой, состоящая из 'OverlapLength' и целого числа в области значений [0, size(Window,1)).

Типы данных: single | double

Количество интервалов раньше вычисляло ДПФ оконных входных выборок, заданных как пара, разделенная запятой, состоящая из 'FFTLength' и положительного скалярного целого числа. Если незаданный, значения по умолчанию FFTLength к числу элементов в Window.

Типы данных: single | double

Частотный диапазон в Гц, заданном как пара, разделенная запятой, состоящая из 'Range' и двухэлементный вектор - строка из увеличения действительных значений в области значений [0, f/2].

Типы данных: single | double

Тип спектра, заданный как пара, разделенная запятой, состоящая из 'SpectrumType' и 'power' или 'magnitude':

  • 'power' – Спектральная скошенность вычисляется для одностороннего спектра мощности.

  • 'magnitude' – Спектральная скошенность вычисляется для одностороннего спектра значения.

Типы данных: char | string

Выходные аргументы

свернуть все

Спектральная скошенность, возвращенная как скаляр, вектор или матрица. Каждая строка skewness соответствует спектральной скошенности окна x. Каждый столбец skewness соответствует независимому каналу.

Спектральное распространение, возвращенное как скаляр, вектор или матрица. Каждая строка spread соответствует спектральному распространению окна x. Каждый столбец spread соответствует независимому каналу.

Спектральный центроид в Гц, возвращенном как скаляр, вектор или матрица. Каждая строка centroid соответствует спектральному центроиду окна x. Каждый столбец centroid соответствует независимому каналу.

Алгоритмы

Спектральная скошенность вычисляется, как описано в [1]:

скошенность=k=b1b2(fkμ1)3sk(μ2)3k=b1b2sk

где

  • fk является частотой в Гц, соответствующем интервалу k.

  • sk является спектральным значением в интервале k.

  • b 1 и b 2 является ребрами полосы в интервалах, по которым можно вычислить спектральную скошенность.

  • μ 1 является спектральным центроидом, вычисленным, как описано функцией spectralCentroid.

  • μ 2 является спектральным распространением, вычисленным, как описано функцией spectralSpread.

Ссылки

[1] Петерс, G. "Большой набор функций аудио для звукового описания (Подобие и классификация) в проекте CUIDADO". Технический отчет; IRCAM: Париж, Франция, 2004.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте