spectralFlux

Спектральный поток для аудиосигналов и слуховых спектрограмм

Свернуть все на странице

Синтаксис

flux = spectralFlux(x,f)

flux = spectralFlux(x,f,initialCondition)

flux = spectralFlux(___,Name,Value)

[flux,finalCondition] = spectralFlux(___)

Описание

пример

flux = spectralFlux(x,f) возвращает спектральный поток сигнала, x, со временем. Спектральный поток является мерой изменчивости спектра с течением времени. Как интерпретируется функция x зависит от формы f.

пример

flux = spectralFlux(x,f,initialCondition) задает предыдущее спектральное состояние. Этот синтаксис поддерживается только для входов частотного диапазона.

пример

flux = spectralFlux(___,Name,Value) задает опции с использованием одного или нескольких Name,Value аргументы в виде пар.

Для примера, flux = spectralFlux(x,f,'NormType',1) вычисляет спектральный поток по норме типа 1.

пример

[flux,finalCondition] = spectralFlux(___) также возвращает окончательное спектральное состояние.

Примеры

свернуть все

Спектральный поток аудио во временной области

Открыть Live Script

Прочтите в аудио файла, вычислите поток с помощью параметров по умолчанию, а затем постройте график результатов.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
flux = spectralFlux(audioIn,fs);

t = linspace(0,size(audioIn,1)/fs,size(flux,1));
plot(t,flux)
xlabel('Time (s)')
ylabel('Flux')

Figure contains an axes. The axes contains an object of type line.

Спектральный поток Частотного диапазона аудио Данных

Открыть Live Script

Прочтите в аудио файла, а затем вычислите mel spectrogram с помощью melSpectrogram функция. Вычислите поток мел-спектрограммы с течением времени. Постройте график результатов.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

[s,cf,t] = melSpectrogram(audioIn,fs);

flux = spectralFlux(s,cf);

plot(t,flux)
xlabel('Time (s)')
ylabel('Flux')

Figure contains an axes. The axes contains an object of type line.

Задайте параметры Nondefault

Открыть Live Script

Чтение в аудио файла.

[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');

Вычислите поток спектра степени с течением времени. Вычислите поток для 50 мс Окон Хэмминга данных с перекрытием 25 мс. Используйте область значений от 62,5 Гц до fs/ 2 для вычисления потока. Постройте график результатов.

flux = spectralFlux(audioIn,fs, ...
                    'Window',hamming(round(0.05*fs)), ...
                    'OverlapLength',round(0.025*fs), ...
                    'Range',[62.5,fs/2]);
                        
t = linspace(0,size(audioIn,1)/fs,size(flux,1));
plot(t,flux)
xlabel('Time (s)')
ylabel('Flux')

Figure contains an axes. The axes contains an object of type line.

Вычисление спектрального потока передачи потокового аудио

Открыть Live Script

Спектральный поток измеряет изменение в последовательных спектрах. Чтобы вычислить спектральный поток передачи потокового аудио, можно передать состояние внутри и вне функции.

Создайте dsp.AudioFileReader объект для чтения в аудио данных кадр за кадром. Создайте dsp.AsyncBuffer объект для буферизации аудио входа в перекрывающиеся системы координат. Создайте вторую dsp.AsyncBuffer объект для логгирования вычисления спектрального потока.

fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav');
inputBuffer = dsp.AsyncBuffer;
logger = dsp.AsyncBuffer;

В цикле аудиопотока:

Чтение в систему координат аудио данных из вашего источника.
Запишите аудио данных в буфер входа.
Если узел данных доступен из буфера, считайте систему координат данных с перекрытием.
Вычислите одностороннюю величину короткого преобразования Фурье.
Вычислите спектральный поток.
Логгирование спектрального потока для последующего графического изображения.

fs = fileReader.SampleRate;

samplesPerFrame = round(fs*0.05);
samplesOverlap = round(fs*0.025);

samplesPerHop = samplesPerFrame - samplesOverlap;

win = hamming(samplesPerFrame,'periodic');

Sprev = [];
while ~isDone(fileReader)
    audioIn = fileReader();
    write(inputBuffer,audioIn);
    
    while inputBuffer.NumUnreadSamples >= samplesPerHop
        audioBuffered = read(inputBuffer,samplesPerFrame,samplesOverlap);
        [S,f] = stft(audioBuffered,fs,"Window",win,"OverlapLength",samplesOverlap,"FrequencyRange","onesided");
        [flux,Sprev] = spectralFlux(abs(S),f,Sprev);
        write(logger,flux);
    end
    
end
release(fileReader)

Постройте график записанных данных.

plot(read(logger))
ylabel('Flux')

Figure contains an axes. The axes contains an object of type line.

Входные параметры

свернуть все

`x` - Входной сигнал
Вектор-столбец | матрицу | трехмерный массив

Входной сигнал, заданный как вектор, матрица или трехмерный массив. Как интерпретируется функция x зависит от формы f.

Типы данных: single | double

`f` - Частота дискретизации или вектор частоты (Гц)
скалярный вектор |

Частота дискретизации или вектор частоты в Гц, заданная в виде скаляра или вектора, соответственно. Как интерпретируется функция x зависит от формы f:

Если f является скаляром, x интерпретируется как сигнал временной области и f интерпретируется как частота дискретизации. В этом случае x должен быть вектором действительных чисел или матрицей. Если x задается как матрица, столбцы интерпретируются как отдельные каналы.
Если f является вектором, x интерпретируется как сигнал частотного диапазона и f интерпретируется как частоты в Гц, соответствующие строкам x. В этом случае x должен быть вещественным L -by M -by N массивом, где L - количество спектральных значений на заданных частотах fM - количество отдельных спектров, а N - количество каналов.

Типы данных: single | double

`initialCondition` - Предыдущее спектральное состояние
`[]` (по умолчанию) | матрица

Предыдущее спектральное состояние, заданное как L -by - N матрица, где:

L - количество интервалов в одностороннем спектральном представлении, равное numel (f).
N - количество каналов аудио данных, равное размеру (x,3).

Если initialCondition не задан, или задан как пустой, spectralFlux рассматривает первый спектр как повторяющийся. То есть первый flux выход равен нулю.

Зависимости

Этот входной параметр действителен, только если вход, x, является представлением аудио в частотном диапазоне. spectralFlux функция интерпретирует область входа x на основе размера f.

Типы данных: single | double

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'Window',hamming(256)

`'NormType'` - Нормальный тип
`2` (по умолчанию) | `1`

Нормальный тип, используемый для вычисления потока, задается как разделенная разделенными запятой парами, состоящая из 'NormType' и 2 или 1.

Типы данных: single | double

Примечание

Следующие аргументы пары "имя-значение" применяются, если x является сигналом временной области. Если x является сигналом частотного диапазона, следующие аргументы пары "имя-значение" игнорируются.

`'Window'` - Окно применяется во временном интервале
`ректвин (раунд (f*0.03))` (по умолчанию) | вектор

Окно, примененное во временном интервале, задается как разделенная разделенными запятой парами, состоящая из 'Window' и вектор действительных чисел. Количество элементов в векторе должно быть в области значений [1, size (x,1)]. Количество элементов в векторе также должно быть больше OverlapLength.

Типы данных: single | double

`'OverlapLength'` - Количество проб, перекрывающихся между смежными окнами
`раунд (f*0.02)` (по умолчанию) | неотрицательный скаляр

Количество выборок, перекрывающихся между смежными окнами, заданное как разделенная разделенными запятой парами, состоящая из 'OverlapLength' и целое число в области значений [0, размер (Window,1)).

Типы данных: single | double

`'FFTLength'` - Количество интервалов в ДПФ
`numel (Window)` (по умолчанию) | положительное скалярное целое число

Количество интервалов, используемых для вычисления ДПФ оконных входных выборок, заданное как разделенная разделенными запятой парами, состоящая из 'FFTLength' и положительное скалярное целое число. Если не задано, FFTLength по умолчанию задается количество элементов в Window.

Типы данных: single | double

`'Range'` - Частотная область значений (Гц)
`[0, f/2]` (по умолчанию) | двухэлементный вектор-строка

Частотная область значений в Гц, заданный как разделенная разделенными запятой парами, состоящая из 'Range' и двухэлементный вектор-строка с увеличением вещественных значений в области значений [0, f/2].

Типы данных: single | double

`'SpectrumType'` - Спектральный тип
`'power'` (по умолчанию) | `'magnitude'`

Тип спектра, заданный как разделенная разделенными запятой парами, состоящая из 'SpectrumType' и 'power' или 'magnitude':

'power' - Спектральный поток вычисляется для одностороннего спектра степени.
'magnitude' - Спектральный поток вычисляется для одностороннего спектра величин.

Типы данных: char | string

Выходные аргументы

свернуть все

`flux` - Спектральный поток (Гц)
скаляр | вектор | матрица

Спектральный поток в Гц, возвращаемый в виде скаляра, вектора или матрицы. Каждая строка flux соответствует спектральному потоку окна x. Каждый столбец flux соответствует независимому каналу.

`finalCondition` - Конечное спектральное состояние
матрица

Окончательное спектральное состояние, возвращенное как L -by - N матрица, где:

L - количество интервалов в одностороннем спектральном представлении, равное numel (f).
N - количество каналов аудио данных, равное размеру (x,3).

Зависимости

Этот выходной аргумент действителен, только если вход, x, является представлением аудио в частотном диапазоне. spectralFlux функция интерпретирует область входа x на основе размера f.

Алгоритмы

Спектральный поток вычисляется как описано в [1]:

$flux(t) = {(\sum_{k = b_{1}}^{b_{2}} {| s_{k} (t) - s_{k} (t - 1) |}^{P})}^{\frac{1}{P}}$

где

_sk - спектральное значение в k интервала.
b 1 и _b 2 являются краями диапазона в интервалах, по которым можно вычислить спектральный поток.
P является типом нормы. Тип нормы можно задать используя NormType.

Ссылки

[1] Шейрер, Э. и М. Слейни. «Конструкция и оценка робастного мультифеатурного речевого/музыкального дискриминатора». Международная конференция IEEE по акустике, речи и обработке сигналов. Том 2, 1997, с. 1221-1224.

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Массивы графических процессоров
Ускорите код, запустив на графическом процессорном модуле (GPU) с помощью Parallel Computing Toolbox™.

См. также

acousticFluctuation | integratedLoudness | spectralCentroid | splMeter

Темы

Спектральные дескрипторы

Введенный в R2019a

Документация

spectralFlux

Синтаксис

Описание

Примеры

Спектральный поток аудио во временной области

Спектральный поток Частотного диапазона аудио Данных

Задайте параметры Nondefault

Вычисление спектрального потока передачи потокового аудио

Входные параметры

`x` - Входной сигнал
Вектор-столбец | матрицу | трехмерный массив

`f` - Частота дискретизации или вектор частоты (Гц)
скалярный вектор |

`initialCondition` - Предыдущее спектральное состояние
`[]` (по умолчанию) | матрица

Зависимости

Аргументы в виде пар имя-значение

`'NormType'` - Нормальный тип
`2` (по умолчанию) | `1`

`'Window'` - Окно применяется во временном интервале
`ректвин (раунд (f*0.03))` (по умолчанию) | вектор

`'OverlapLength'` - Количество проб, перекрывающихся между смежными окнами
`раунд (f*0.02)` (по умолчанию) | неотрицательный скаляр

`'FFTLength'` - Количество интервалов в ДПФ
`numel (Window)` (по умолчанию) | положительное скалярное целое число

`'Range'` - Частотная область значений (Гц)
`[0, f/2]` (по умолчанию) | двухэлементный вектор-строка

`'SpectrumType'` - Спектральный тип
`'power'` (по умолчанию) | `'magnitude'`

Выходные аргументы

`flux` - Спектральный поток (Гц)
скаляр | вектор | матрица

`finalCondition` - Конечное спектральное состояние
матрица

Зависимости

Алгоритмы

Ссылки

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Массивы графических процессоров
Ускорите код, запустив на графическом процессорном модуле (GPU) с помощью Parallel Computing Toolbox™.

См. также

Темы

Документация Audio Toolbox

Поддержка

Документация

spectralFlux

Синтаксис

Описание

Примеры

Спектральный поток аудио во временной области

Спектральный поток Частотного диапазона аудио Данных

Задайте параметры Nondefault

Вычисление спектрального потока передачи потокового аудио

Входные параметры

x - Входной сигнал Вектор-столбец | матрицу | трехмерный массив

f - Частота дискретизации или вектор частоты (Гц) скалярный вектор |

initialCondition - Предыдущее спектральное состояние [] (по умолчанию) | матрица

Зависимости

Аргументы в виде пар имя-значение

'NormType' - Нормальный тип 2 (по умолчанию) | 1

'Window' - Окно применяется во временном интервале ректвин (раунд (f*0.03)) (по умолчанию) | вектор

'OverlapLength' - Количество проб, перекрывающихся между смежными окнами раунд (f*0.02) (по умолчанию) | неотрицательный скаляр

'FFTLength' - Количество интервалов в ДПФ numel (Window) (по умолчанию) | положительное скалярное целое число

'Range' - Частотная область значений (Гц) [0, f/2] (по умолчанию) | двухэлементный вектор-строка

'SpectrumType' - Спектральный тип 'power' (по умолчанию) | 'magnitude'

Выходные аргументы

flux - Спектральный поток (Гц) скаляр | вектор | матрица

finalCondition - Конечное спектральное состояние матрица

Зависимости

Алгоритмы

Ссылки

Расширенные возможности

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Массивы графических процессоров Ускорите код, запустив на графическом процессорном модуле (GPU) с помощью Parallel Computing Toolbox™.

См. также

Темы

Документация Audio Toolbox

Поддержка

`x` - Входной сигнал
Вектор-столбец | матрицу | трехмерный массив

`f` - Частота дискретизации или вектор частоты (Гц)
скалярный вектор |

`initialCondition` - Предыдущее спектральное состояние
`[]` (по умолчанию) | матрица

`'NormType'` - Нормальный тип
`2` (по умолчанию) | `1`

`'Window'` - Окно применяется во временном интервале
`ректвин (раунд (f*0.03))` (по умолчанию) | вектор

`'OverlapLength'` - Количество проб, перекрывающихся между смежными окнами
`раунд (f*0.02)` (по умолчанию) | неотрицательный скаляр

`'FFTLength'` - Количество интервалов в ДПФ
`numel (Window)` (по умолчанию) | положительное скалярное целое число

`'Range'` - Частотная область значений (Гц)
`[0, f/2]` (по умолчанию) | двухэлементный вектор-строка

`'SpectrumType'` - Спектральный тип
`'power'` (по умолчанию) | `'magnitude'`

`flux` - Спектральный поток (Гц)
скаляр | вектор | матрица

`finalCondition` - Конечное спектральное состояние
матрица

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Массивы графических процессоров
Ускорите код, запустив на графическом процессорном модуле (GPU) с помощью Parallel Computing Toolbox™.