Спектральный поток для звуковых сигналов и слуховых спектрограмм
Читайте в звуковом файле, вычислите поток с помощью параметров по умолчанию, и затем постройте результаты.
[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav'); flux = spectralFlux(audioIn,fs); t = linspace(0,size(audioIn,1)/fs,size(flux,1)); plot(t,flux) xlabel('Time (s)') ylabel('Flux')
Читайте в звуковом файле и затем вычислите mel спектрограмму с помощью melSpectrogram
функция. Вычислите поток mel спектрограммы в зависимости от времени. Постройте график результатов.
[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav'); [s,cf,t] = melSpectrogram(audioIn,fs); flux = spectralFlux(s,cf); plot(t,flux) xlabel('Time (s)') ylabel('Flux')
Читайте в звуковом файле.
[audioIn,fs] = audioread('Counting-16-44p1-mono-15secs.wav');
Вычислите поток спектра мощности в зависимости от времени. Вычислите поток для Окон Хэмминга на 50 мс данных с перекрытием на 25 мс. Используйте диапазон от 62,5 Гц до fs
/2 для вычисления потока. Постройте график результатов.
flux = spectralFlux(audioIn,fs, ... 'Window',hamming(round(0.05*fs)), ... 'OverlapLength',round(0.025*fs), ... 'Range',[62.5,fs/2]); t = linspace(0,size(audioIn,1)/fs,size(flux,1)); plot(t,flux) xlabel('Time (s)') ylabel('Flux')
Спектральный поток измеряет изменение в последовательных спектрах. Чтобы вычислить спектральный поток для сигнала передачи потокового аудио, необходимо ввести по крайней мере две системы координат аудиоданных.
Создайте dsp.AudioFileReader
возразите, чтобы читать в покадровых аудиоданных. Создайте dsp.AsyncBuffer
буферизовать аудио в перекрытые системы координат. Создайте dsp.SignalSink
регистрировать спектральное вычисление потока.
fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav');
buff = dsp.AsyncBuffer;
logger = dsp.SignalSink;
В цикле аудиопотока:
Читайте в системе координат аудиоданных из вашего источника.
Запишите аудиоданные в dsp.AsyncBuffer
Если система координат данных доступна от буфера, считайте систему координат и один транзитный участок данных с перекрытием, равным выборкам на систему координат. Это представляет две новых аудио системы координат.
Вычислите спектральный поток для двух новых аудио систем координат.
Регистрируйте спектральный поток для более позднего графического вывода. Поскольку поток задан текущей системой координат и предыдущей системой координат, и потому что условие перед первой системой координат неизвестно функции, спектральный поток выводит поток нуля для первой системы координат. Регистрируйте только второе значение выход от spectralFlux
.
fs = fileReader.SampleRate; samplesPerFrame = round(fs*0.05); samplesOverlap = round(fs*0.025); samplesPerHop = samplesPerFrame - samplesOverlap; win = hamming(samplesPerFrame); while ~isDone(fileReader) audioIn = fileReader(); write(buff,audioIn); while buff.NumUnreadSamples >= samplesPerHop audioBuffered = read(buff,samplesPerFrame+samplesPerHop,samplesPerFrame); flux = spectralFlux(audioBuffered,fs, ... 'Window',win, ... 'OverlapLength',samplesOverlap); logger(flux(end)) end end release(fileReader)
Постройте записанные данные.
plot(logger.Buffer)
ylabel('Flux')
x
— Входной сигналВходной сигнал, заданный как вектор, матрица или трехмерный массив. Как функция интерпретирует x
зависит от формы f
.
Типы данных: single
| double
f
— Частота дискретизации или вектор частоты (Гц)Частота дискретизации или вектор частоты в Гц, заданном как скаляр или вектор, соответственно. Как функция интерпретирует x
зависит от формы f
:
Если f
скаляр, x
интерпретирован как сигнал временной области и f
интерпретирован как частота дискретизации. В этом случае, x
должен быть вектор действительных чисел или матрица. Если x
задан как матрица, столбцы интерпретированы, когда индивидуум образовывает канал.
Если f
вектор, x
интерпретирован как сигнал частотного диапазона и f
интерпретирован как частоты, в Гц, соответствуя строкам x
. В этом случае, x
должен быть действительный L-by-M-by-N массив, где L является количеством спектральных значений на данных частотах f
, M является количеством отдельных спектров, и N является количеством каналов.
Количество строк x
, L, должно быть равно числу элементов f
.
Типы данных: single
| double
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
'Window',hamming(256)
'NormType'
— Тип нормы
(значение по умолчанию) | 1
Тип нормы раньше вычислял, заданный как разделенная запятой пара, состоящая из 'NormType'
и 2
или 1
.
Типы данных: single
| double
Следующие аргументы пары "имя-значение" применяются если x
сигнал временной области. Если x
сигнал частотного диапазона, аргументы пары "имя-значение" проигнорированы.
'Window'
— Окно применяется во временном интервалеrectwin (вокруг (f
*0.03))
(значение по умолчанию) | векторОкно применяется во временном интервале, заданном как разделенная запятой пара, состоящая из 'Window'
и вектор действительных чисел. Число элементов в векторе должно быть в области значений [1, размер (
]. Число элементов в векторе должно также быть больше x
,1)OverlapLength
.
Типы данных: single
| double
'OverlapLength'
— Количество выборок перекрывается между смежными окнамивокруг (f
*0.02)
(значение по умолчанию) | неотрицательный скалярКоличество выборок перекрывается между смежными окнами, заданными как разделенная запятой пара, состоящая из 'OverlapLength'
и целое число в области значений [0, размер (
).Window
,1)
Типы данных: single
| double
'FFTLength'
— Количество интервалов в ДПФnumel (Window
)
(значение по умолчанию) | положительное скалярное целое числоКоличество интервалов раньше вычисляло ДПФ оконных входных выборок, заданных как разделенная запятой пара, состоящая из 'FFTLength'
и положительное скалярное целое число. Если незаданный, FFTLength
значения по умолчанию к числу элементов в Window
.
Типы данных: single
| double
'Range'
— Частотный диапазон (Гц)[0, f
/2]
(значение по умолчанию) | двухэлементный вектор-строкаЧастотный диапазон в Гц, заданном как разделенная запятой пара, состоящая из 'Range'
и двухэлементный вектор-строка из увеличения действительных значений в области значений [0, f
/2].
Типы данных: single
| double
'SpectrumType'
— Тип спектра'power'
(значение по умолчанию) | 'magnitude'
Тип спектра, заданный как разделенная запятой пара, состоящая из 'SpectrumType'
и 'power'
или 'magnitude'
:
'power'
– Спектральный поток вычисляется для одностороннего спектра мощности.
'magnitude'
– Спектральный поток вычисляется для одностороннего спектра величины.
Типы данных: char |
string
flux
— Спектральный поток (Гц)Спектральный поток в Гц, возвращенном как скаляр, вектор или матрица. Каждая строка flux
соответствует спектральному потоку окна x
. Каждый столбец flux
соответствует независимому каналу.
Спектральный поток вычисляется как описано в [1]:
где
sk является спектральным значением в интервале k.
b 1 и b 2 является ребрами полосы в интервалах, по которым можно вычислить спектральный поток.
P является типом нормы. Можно задать тип нормы с помощью NormType
.
[1] Scheirer, E. и М. Слэни. "Конструкция и Оценка Устойчивого Различителя Речи/Музыки Мультифункции". Международная конференция IEEE по вопросам Акустики, Речи и Обработки сигналов. Объем 2, 1997, стр 1221–1224.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.