spectralSpread

Спектральное распространение для звуковых сигналов и слуховых спектрограмм

Описание

пример

spread = spectralSpread(x,f) возвращает спектральное распространение сигнала, x, в зависимости от времени. Как функция интерпретирует x зависит от формы f.

пример

spread = spectralSpread(x,f,Name,Value) задает опции с помощью одного или нескольких Name,Value парные аргументы.

[spread,centroid] = spectralSpread(___) возвращает спектральный центроид.

Примеры

свернуть все

Читайте в звуковом файле, вычислите распространение с помощью параметров по умолчанию, и затем постройте результаты.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
spread = spectralSpread(audioIn,fs);

t = linspace(0,size(audioIn,1)/fs,size(spread,1));
plot(t,spread)
xlabel('Time (s)')
ylabel('Spread (Hz)')

Figure contains an axes. The axes contains an object of type line.

Читайте в звуковом файле и затем вычислите mel спектрограмму с помощью melSpectrogram функция. Вычислите распространение mel спектров в зависимости от времени. Постройте график результатов.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

[s,cf,t] = melSpectrogram(audioIn,fs);

spread = spectralSpread(s,cf);

plot(t,spread)
xlabel('Time (s)')
ylabel('Spread (Hz)')

Figure contains an axes. The axes contains an object of type line.

Читайте в звуковом файле.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

Вычислите распространение спектра мощности в зависимости от времени. Вычислите распространение для Окон Хэмминга на 50 мс данных с перекрытием на 25 мс. Используйте диапазон от 62,5 Гц до fs/2 для вычисления распространения. Постройте график результатов.

spread = spectralSpread(audioIn,fs, ...
                       'Window',hamming(round(0.05*fs)), ...
                       'OverlapLength',round(0.025*fs), ...
                       'Range',[62.5,fs/2]);
                        
t = linspace(0,size(audioIn,1)/fs,size(spread,1));
plot(t,spread)
xlabel('Time (s)')
ylabel('Spread (Hz)')

Figure contains an axes. The axes contains an object of type line.

Создайте dsp.AudioFileReader возразите, чтобы читать в покадровых аудиоданных. Создайте dsp.SignalSink регистрировать спектральное вычисление распространения.

fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav');
logger = dsp.SignalSink;

В цикле аудиопотока:

  1. Читайте в системе координат аудиоданных.

  2. Вычислите спектральное распространение для системы координат аудио.

  3. Регистрируйте спектральное распространение для более позднего графического вывода.

Чтобы вычислить спектральное распространение только для данного входного кадра, задайте окно с тем же количеством выборок как вход и обнулите длину перекрытия. Постройте записанные данные.

win = hamming(fileReader.SamplesPerFrame);
while ~isDone(fileReader)
    audioIn = fileReader();
    spread = spectralSpread(audioIn,fileReader.SampleRate, ...
                           'Window',win, ...
                           'OverlapLength',0);
    logger(spread)
end

plot(logger.Buffer)
ylabel('Spread (Hz)')

Figure contains an axes. The axes contains an object of type line.

Используйте dsp.AsyncBuffer если

  • Вход к вашему циклу аудиопотока имеет переменные выборки на систему координат.

  • Вход к вашему циклу аудиопотока имеет противоречивые выборки на систему координат с аналитическим окном spectralSpread.

  • Вы хотите вычислить спектральное распространение для перекрытых данных.

Создайте dsp.AsyncBuffer объект, сброс регистратор и релиз средство чтения файлов.

buff = dsp.AsyncBuffer;
reset(logger)
release(fileReader)

Укажите, что спектральное распространение вычисляется для систем координат на 50 мс с перекрытием на 25 мс.

fs = fileReader.SampleRate;

samplesPerFrame = round(fs*0.05);
samplesOverlap = round(fs*0.025);

samplesPerHop = samplesPerFrame - samplesOverlap;

win = hamming(samplesPerFrame);

while ~isDone(fileReader)
    audioIn = fileReader();
    write(buff,audioIn);
    
    while buff.NumUnreadSamples >= samplesPerHop
        audioBuffered = read(buff,samplesPerFrame,samplesOverlap);
        
        spread = spectralSpread(audioBuffered,fs, ...
                               'Window',win, ...
                               'OverlapLength',0);
        logger(spread)
    end
    
end
release(fileReader)

Постройте записанные данные.

plot(logger.Buffer)
ylabel('Spread (Hz)')

Figure contains an axes. The axes contains an object of type line.

Входные параметры

свернуть все

Входной сигнал в виде вектора, матрицы или трехмерного массива. Как функция интерпретирует x зависит от формы f.

Типы данных: single | double

Частота дискретизации или вектор частоты в Гц в виде скаляра или вектор, соответственно. Как функция интерпретирует x зависит от формы f:

  • Если f скаляр, x интерпретирован как сигнал временной области и f интерпретирован как частота дискретизации. В этом случае, x должен быть вектор действительных чисел или матрица. Если x задан как матрица, столбцы интерпретированы, когда индивидуум образовывает канал.

  • Если f вектор, x интерпретирован как сигнал частотного диапазона и f интерпретирован как частоты, в Гц, соответствуя строкам x. В этом случае, x должен быть действительный L-by-M-by-N массив, где L является количеством спектральных значений на данных частотах f, M является количеством отдельных спектров, и N является количеством каналов.

  • Количество строк x, L, должно быть равно числу элементов f.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Window',hamming(256)

Примечание

Следующие аргументы пары "имя-значение" применяются если x сигнал временной области. Если x сигнал частотного диапазона, аргументы пары "имя-значение" проигнорированы.

Окно, примененное во временном интервале в виде разделенной запятой пары, состоящей из 'Window' и вектор действительных чисел. Число элементов в векторе должно быть в области значений [1, размер (x,1)]. Число элементов в векторе должно также быть больше OverlapLength.

Типы данных: single | double

Количество выборок, перекрытых между смежными окнами в виде разделенной запятой пары, состоящей из 'OverlapLength' и целое число в области значений [0, размер (Window,1)).

Типы данных: single | double

Количество интервалов раньше вычисляло ДПФ оконных входных выборок в виде разделенной запятой пары, состоящей из 'FFTLength' и положительное скалярное целое число. Если незаданный, FFTLength значения по умолчанию к числу элементов в Window.

Типы данных: single | double

Частотный диапазон в Гц в виде разделенной запятой пары, состоящей из 'Range' и двухэлементный вектор-строка из увеличения действительных значений в области значений [0, f/2].

Типы данных: single | double

Тип спектра в виде разделенной запятой пары, состоящей из 'SpectrumType' и 'power' или 'magnitude':

  • 'power' – Спектральное распространение вычисляется для одностороннего спектра мощности.

  • 'magnitude' – Спектральное распространение вычисляется для одностороннего спектра величины.

Типы данных: char | string

Выходные аргументы

свернуть все

Спектральное распространение в Гц, возвращенном как скаляр, вектор или матрица. Каждая строка centroid соответствует спектральному распространению окна x. Каждый столбец spread соответствует независимому каналу.

Спектральный центроид в Гц, возвращенном как скаляр, вектор или матрица. Каждая строка centroid соответствует спектральному центроиду окна x. Каждый столбец centroid соответствует независимому каналу.

Алгоритмы

Спектральное распространение вычисляется как описано в [1]:

spread=k=b1b2(fkμ1)2skk=b1b2sk

где

  • fk является частотой в Гц, соответствующем интервалу k.

  • sk является спектральным значением в интервале k.

  • b 1 и b 2 является ребрами полосы в интервалах, по которым можно вычислить спектральное распространение.

  • μ 1 является спектральным центроидом, вычисленным аналогичный описанному spectralCentroid функция.

Ссылки

[1] Петерс, G. "Большой набор функций аудио для звукового описания (Подобие и классификация) в проекте CUIDADO". Технический отчет; IRCAM: Париж, Франция, 2004.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Введенный в R2019a
Для просмотра документации необходимо авторизоваться на сайте