spectralSlope

Спектральный наклон для звуковых сигналов и слуховых спектрограмм

Описание

пример

slope = spectralSlope(x,f) возвращает спектральный наклон сигнала, x, в зависимости от времени. Как функция интерпретирует x зависит от формы f.

пример

slope = spectralSlope(x,f,Name,Value) задает опции с помощью одного или нескольких Name,Value парные аргументы.

Примеры

свернуть все

Читайте в звуковом файле, вычислите наклон с помощью параметров по умолчанию, и затем постройте результаты.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
slope = spectralSlope(audioIn,fs);

t = linspace(0,size(audioIn,1)/fs,size(slope,1));
plot(t,slope)
xlabel('Time (s)')
ylabel('Slope')

Читайте в звуковом файле и затем вычислите mel спектрограмму с помощью melSpectrogram функция. Вычислите наклон mel спектрограммы в зависимости от времени. Постройте график результатов.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

[s,cf,t] = melSpectrogram(audioIn,fs);

slope = spectralSlope(s,cf);

plot(t,slope)
xlabel('Time (s)')
ylabel('Slope')

Читайте в звуковом файле.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

Вычислите наклон спектра величины в зависимости от времени. Вычислите наклон для Окон Хэмминга на 50 мс данных с перекрытием на 25 мс. Используйте диапазон от 62,5 Гц до fs/2 для наклонного вычисления. Постройте график результатов.

slope = spectralSlope(audioIn,fs, ...
                    'Window',hamming(round(0.05*fs)), ...
                    'OverlapLength',round(0.025*fs), ...
                    'Range',[62.5,fs/2]);
                        
t = linspace(0,size(audioIn,1)/fs,size(slope,1));
plot(t,slope)
xlabel('Time (s)')
ylabel('Slope')

Создайте dsp.AudioFileReader возразите, чтобы читать в покадровых аудиоданных. Создайте dsp.SignalSink регистрировать спектральное наклонное вычисление.

fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav');
logger = dsp.SignalSink;

В цикле аудиопотока:

  1. Читайте в системе координат аудиоданных.

  2. Вычислите спектральный наклон для системы координат аудио.

  3. Регистрируйте спектральный наклон для более позднего графического вывода.

Чтобы вычислить спектральный наклон только для данного входного кадра, задайте окно с тем же количеством выборок как вход и обнулите длину перекрытия. Постройте записанные данные.

win = hamming(fileReader.SamplesPerFrame);
while ~isDone(fileReader)
    audioIn = fileReader();
    slope = spectralSlope(audioIn,fileReader.SampleRate, ...
                          'Window',win, ...
                          'OverlapLength',0);
    logger(slope)
end

plot(logger.Buffer)
ylabel('Slope')

Используйте dsp.AsyncBuffer если

  • Вход к вашему циклу аудиопотока имеет переменные выборки на систему координат.

  • Вход к вашему циклу аудиопотока имеет противоречивые выборки на систему координат с аналитическим окном spectralSlope.

  • Вы хотите вычислить спектральный наклон для перекрытых данных.

Создайте dsp.AsyncBuffer объект, сброс регистратор и релиз средство чтения файлов.

buff = dsp.AsyncBuffer;
reset(logger)
release(fileReader)

Укажите, что спектральный наклон вычисляется для систем координат на 50 мс с перекрытием на 25 мс.

fs = fileReader.SampleRate;

samplesPerFrame = round(fs*0.05);
samplesOverlap = round(fs*0.025);

samplesPerHop = samplesPerFrame - samplesOverlap;

win = hamming(samplesPerFrame);

while ~isDone(fileReader)
    audioIn = fileReader();
    write(buff,audioIn);
    
    while buff.NumUnreadSamples >= samplesPerHop
        audioBuffered = read(buff,samplesPerFrame,samplesOverlap);
        
        slope = spectralSlope(audioBuffered,fs, ...
                              'Window',win, ...
                              'OverlapLength',0);
        logger(slope)
    end
    
end
release(fileReader)

Постройте записанные данные.

plot(logger.Buffer)
ylabel('Slope')

Входные параметры

свернуть все

Входной сигнал, заданный как вектор, матрица или трехмерный массив. Как функция интерпретирует x зависит от формы f.

Типы данных: single | double

Частота дискретизации или вектор частоты в Гц, заданном как скаляр или вектор, соответственно. Как функция интерпретирует x зависит от формы f:

  • Если f скаляр, x интерпретирован как сигнал временной области и f интерпретирован как частота дискретизации. В этом случае, x должен быть вектор действительных чисел или матрица. Если x задан как матрица, столбцы интерпретированы, когда индивидуум образовывает канал.

  • Если f вектор, x интерпретирован как сигнал частотного диапазона и f интерпретирован как частоты, в Гц, соответствуя строкам x. В этом случае, x должен быть действительный L-by-M-by-N массив, где L является количеством спектральных значений на данных частотах f, M является количеством отдельных спектров, и N является количеством каналов.

  • Количество строк x, L, должно быть равно числу элементов f.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Window',hamming(256)

Примечание

Следующие аргументы пары "имя-значение" применяются если x сигнал временной области. Если x сигнал частотного диапазона, аргументы пары "имя-значение" проигнорированы.

Окно применяется во временном интервале, заданном как разделенная запятой пара, состоящая из 'Window' и вектор действительных чисел. Число элементов в векторе должно быть в области значений [1, размер (x,1)]. Число элементов в векторе должно также быть больше OverlapLength.

Типы данных: single | double

Количество выборок перекрывается между смежными окнами, заданными как разделенная запятой пара, состоящая из 'OverlapLength' и целое число в области значений [0, размер (Window,1)).

Типы данных: single | double

Количество интервалов раньше вычисляло ДПФ оконных входных выборок, заданных как разделенная запятой пара, состоящая из 'FFTLength' и положительное скалярное целое число. Если незаданный, FFTLength значения по умолчанию к числу элементов в Window.

Типы данных: single | double

Частотный диапазон в Гц, заданном как разделенная запятой пара, состоящая из 'Range' и двухэлементный вектор-строка из увеличения действительных значений в области значений [0, f/2].

Типы данных: single | double

Тип спектра, заданный как разделенная запятой пара, состоящая из 'SpectrumType' и 'power' или 'magnitude':

  • 'power' – Спектральный наклон вычисляется для одностороннего спектра мощности.

  • 'magnitude' – Спектральный наклон вычисляется для одностороннего спектра величины.

Типы данных: char | string

Выходные аргументы

свернуть все

Спектральный наклон в Гц, возвращенном как скаляр, вектор или матрица. Каждая строка slope соответствует спектральному наклону окна x. Каждый столбец slope соответствует независимому каналу.

Алгоритмы

Спектральный наклон вычисляется как описано в [1]:

наклон=k=b1b2(fkμf)(skμS)k=b1b2(fkμf)2

где

  • fk является частотой в Гц, соответствующем интервалу k.

  • μf является средней частотой.

  • sk является спектральным значением в интервале k.

  • μs является средним спектральным значением.

  • b 1 и b 2 является ребрами полосы в интервалах, по которым можно вычислить спектральный наклон.

Ссылки

[1] Lerch, Александр. Введение в аналитические приложения звукового содержимого в информатике обработки сигналов и музыки. Пискатауэй, NJ: нажатие IEEE, 2012.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте