audioTimeScaler

Применить масштабирование времени к потоковому аудио

развернуть все на странице

Описание

audioTimeScaler объект выполняет изменение шкалы времени звука (TSM) независимо по каждому входному каналу.

Для изменения шкалы времени потокового звука:

Создать audioTimeScaler и задайте его свойства.
Вызовите объект с аргументами, как если бы это была функция.

Дополнительные сведения о работе системных объектов см. в разделе Что такое системные объекты?.

Создание

Синтаксис

ATS = audioTimeScaler

ATS = audioTimeScaler (коэффициент ускорения)

ATS = audioTimeScaler (___, «Имя», значение)

Описание

aTS = audioTimeScaler создает объект, aTS, которая выполняет изменение шкалы звукового времени независимо по каждому входному каналу во времени.

aTS = audioTimeScaler(speedupFactor) устанавливает SpeedupFactor свойство для speedupFactor.

aTS = audioTimeScaler(___,'Name',Value) задает каждое свойство Name к указанному Value. Неопределенные свойства имеют значения по умолчанию.

Пример: aTS = audioTimeScaler(1.2,'Window',sqrt(hann(1024,'periodic')),'OverlapLength',768) создает объект, aTS, что увеличивает темп звука в 1,2 раза его первоначальной скорости с использованием периодического 1024-точечного окна Ханна и 768-точечного перекрытия.

Свойства

развернуть все

Если не указано иное, свойства не настраиваются, что означает невозможность изменения их значений после вызова объекта. Объекты блокируются при их вызове, и release функция разблокирует их.

Если свойство настраивается, его значение можно изменить в любое время.

Дополнительные сведения об изменении значений свойств см. в разделе Проектирование системы в MATLAB с использованием системных объектов.

`SpeedupFactor` - Коэффициент ускорения
`1.1` (по умолчанию) | положительный вещественный скаляр

Коэффициент ускорения, заданный как положительный действительный скаляр.

Настраиваемый: Да

`InputDomain` - Область входного сигнала
`"Time"` (по умолчанию) | `"Frequency"`

Область входного сигнала, указанная как "Time" или "Frequency".

Типы данных: char | string

`Window` - Окно анализа
`sqrt(hann(512,'periodic'))` (по умолчанию) | реальный вектор

Окно анализа, указанное как реальный вектор.

Примечание

При использовании audioTimeScaler при вводе в частотной области необходимо указать Window как то же окно, используемое для преобразования audioIn в частотную область.

Типы данных: single | double

`OverlapLength` - Длина перекрытия соседних окон анализа
`384` (по умолчанию) | неотрицательное целое число

Длина перекрытия соседних окон анализа, заданная как неотрицательное целое число.

Примечание

При использовании audioTimeScaler при вводе в частотной области необходимо указать OverlapLength как одинаковая длина перекрытия, используемая для преобразования audioIn к частотно-временному представлению.

`FFTLength` - длина БПФ
`[]` (по умолчанию) | положительное скалярное целое

Длина БПФ, заданная как положительное целое число. Значение по умолчанию, [], означает, что длина БПФ равна количеству строк во входном сигнале.

Зависимости

Чтобы включить это свойство, установите InputDomain кому 'Time'.

`LockPhase` - Применить блокировку фазы идентификации
`false` (по умолчанию) | `true`

Применить идентичную фазовую блокировку, указанную как true или false.

Типы данных: logical

Использование

Синтаксис

audioOut = ATS (audioIn)

Описание

пример

audioOut = aTS(audioIn) применяет изменение шкалы времени к входу, audioInи возвращает выходные данные, масштабированные по времени, audioOut.

Входные аргументы

развернуть все

`audioIn` - Входной звук
вектор столбца | матрица

Входной звук, заданный как вектор столбца или матрица. Как audioTimeScaler интерпретирует audioIn зависит от свойства InputDomain.

Если InputDomain имеет значение "Time", audioIn должен быть вектором столбца вещественного N-by-1 или матрицей N-by-C. Число строк, N, должно быть равно или меньше длины транзитного участка (size(audioIn,1) <= numel(Window)-OverlapLength). Столбцы матрицы интерпретируются как отдельные каналы.
Если InputDomain имеет значение "Frequency", указать audioIn в виде вектора вещественного или комплексного NFFT-by-1 столбца или матрицы NFFT-by-C. Количество строк, NFFT, является количеством точек в вычислении DFT и устанавливается при первом вызове масштабатора звукового времени. NFFT должен быть больше или равен длине окна (size(audioIn,1) >= numel(Window)). Столбцы матрицы интерпретируются как отдельные каналы.

Типы данных: single | double
Поддержка комплексного номера: Да

Выходные аргументы

развернуть все

`audioOut` - Сжатый по времени звук
вектор столбца | матрица

Растянутый во времени звук, возвращаемый в виде вектора столбца или матрицы.

Типы данных: single | double

Функции объекта

Чтобы использовать функцию объекта, укажите object™ System в качестве первого входного аргумента. Например, для освобождения системных ресурсов объекта System с именем obj, используйте следующий синтаксис:

release(obj)

развернуть все

Общие для всех системных объектов

`step`	Запустить алгоритм объекта System
`release`	Деблокирование ресурсов и разрешение изменений значений свойств объекта системы и входных признаков
`reset`	Сброс внутренних состояний объекта System

Примеры

свернуть все

Применить изменение шкалы времени к потоковому аудио

Открыть сценарий в реальном времени

Чтобы минимизировать артефакты, вызванные окном, создайте квадратное корневое окно Ганна, способное к идеальной реконструкции. Использовать iscola для проверки конструкции.

win = sqrt(hann(1024,'periodic'));
overlapLength = 896;
iscola(win,overlapLength)

ans = logical
   1

Создание audioTimeScaler с коэффициентом ускорения 1.5. Изменение значения alpha чтобы услышать влияние фактора ускорения.

alpha = 1.5;
aTS = audioTimeScaler( ...
    'SpeedupFactor',alpha, ...
    'Window',win, ...
    'OverlapLength',overlapLength);

Создать dsp.AudioFileReader объект для считывания кадров из аудиофайла. Длина кадров, вводимых в устройство масштабирования звукового времени, должна быть меньше или равна длине прыжка анализа, определенной в audioTimeScaler. Чтобы минимизировать буферизацию, задайте длину прыжка анализа для выборок на кадр устройства чтения файлов.

hopLength = numel(aTS.Window) - overlapLength;
fileReader = dsp.AudioFileReader('Counting-16-44p1-mono-15secs.wav', ...
    'SamplesPerFrame',hopLength);

Создание audioDeviceWriter для записи кадров на аудиоустройство. Используйте ту же частоту выборки, что и средство чтения файлов.

deviceWriter = audioDeviceWriter('SampleRate',fileReader.SampleRate);

В цикле аудиопотока прочитайте кадр файла, примените изменение шкалы времени, а затем запишите кадр в устройство.

while ~isDone(fileReader)
    audioIn = fileReader();
    audioOut = aTS(audioIn);
    deviceWriter(audioOut);
end

Рекомендуется деблокировать объекты после их завершения.

release(deviceWriter)
release(fileReader)
release(aTS)

Вход частотной области процесса

Открыть сценарий в реальном времени

Создайте окно, способное к идеальной реконструкции. Использовать iscola для проверки конструкции.

win = kbdwin(512);
overlapLength = 256;
iscola(win,overlapLength)

ans = logical
   1

Создание audioTimeScaler с коэффициентом ускорения 0.8. Набор InputDomain кому "Frequency" и задают длину окна и перекрытия, используемую для преобразования звука временной области в частотную область. Набор LockPhase кому true для повышения точности вывода в масштабе времени.

alpha = 0.8;
timeScaleModification = audioTimeScaler( ...
    "SpeedupFactor",alpha, ...
    "InputDomain","Frequency", ...
    "Window",win, ...
    "OverlapLength",overlapLength, ...
    "LockPhase",true);

Создать dsp.AudioFileReader объект для считывания кадров из аудиофайла. Создать dsp.STFT объект для выполнения кратковременного преобразования Фурье в потоковом аудио. Укажите то же окно и длину перекрытия, что и при создании audioTimeScaler. Создание audioDeviceWriter объект для записи кадров на аудиоустройство.

fileReader = dsp.AudioFileReader('RockDrums-44p1-stereo-11secs.mp3','SamplesPerFrame',numel(win)-overlapLength);

shortTimeFourierTransform = dsp.STFT('Window',win,'OverlapLength',overlapLength,'FFTLength',numel(win));

deviceWriter = audioDeviceWriter('SampleRate',fileReader.SampleRate);

В цикле аудиопотока:

Прочтите кадр из файла.
Введите кадр в STFT. dsp.STFT объект выполняет буферизацию.
Применить изменение шкалы времени.
Запишите измененный звук на аудиоустройство.

while ~isDone(fileReader)
    x = fileReader();
    X = shortTimeFourierTransform(x);
    y = timeScaleModification(X);
    deviceWriter(y);
end

Рекомендуется деблокировать объекты после их завершения.

release(fileReader)
release(shortTimeFourierTransform)
release(timeScaleModification)
release(deviceWriter)

Алгоритмы

audioTimeScaler использует тот же алгоритм фазового вокодера, что и stretchAudio и основывается на описаниях в [1] и [2].

Ссылки

[1] Дриджер, Джонатан и Майнард Мюллер. «Обзор изменения музыкальных сигналов в масштабе времени». Прикладные науки. Том 6, выпуск 2, 2016.

[2] Дриджер, Джонатан. «Алгоритмы изменения масштаба времени для музыкальных аудиосигналов». Магистерская диссертация, Саарский университет, 2011 год.

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

Примечания и ограничения по использованию:

Системные объекты в генерации кода MATLAB (кодер MATLAB)

См. также

audioDataAugmenter | shiftPitch | stretchAudio

Представлен в R2019b

Документация

audioTimeScaler

Описание

Создание

Синтаксис

Описание

Свойства

`SpeedupFactor` - Коэффициент ускорения
`1.1` (по умолчанию) | положительный вещественный скаляр

`InputDomain` - Область входного сигнала
`"Time"` (по умолчанию) | `"Frequency"`

`Window` - Окно анализа
`sqrt(hann(512,'periodic'))` (по умолчанию) | реальный вектор

`OverlapLength` - Длина перекрытия соседних окон анализа
`384` (по умолчанию) | неотрицательное целое число

`FFTLength` - длина БПФ
`[]` (по умолчанию) | положительное скалярное целое

Зависимости

`LockPhase` - Применить блокировку фазы идентификации
`false` (по умолчанию) | `true`

Использование

Синтаксис

Описание

Входные аргументы

`audioIn` - Входной звук
вектор столбца | матрица

Выходные аргументы

`audioOut` - Сжатый по времени звук
вектор столбца | матрица

Функции объекта

Общие для всех системных объектов

Примеры

Применить изменение шкалы времени к потоковому аудио

Вход частотной области процесса

Алгоритмы

Ссылки

Расширенные возможности

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Документация по панели инструментов Audio

Поддержка

Документация

audioTimeScaler

Описание

Создание

Синтаксис

Описание

Свойства

SpeedupFactor - Коэффициент ускорения 1.1 (по умолчанию) | положительный вещественный скаляр

InputDomain - Область входного сигнала "Time" (по умолчанию) | "Frequency"

Window - Окно анализа sqrt(hann(512,'periodic')) (по умолчанию) | реальный вектор

OverlapLength - Длина перекрытия соседних окон анализа 384 (по умолчанию) | неотрицательное целое число

FFTLength - длина БПФ [] (по умолчанию) | положительное скалярное целое

Зависимости

LockPhase - Применить блокировку фазы идентификации false (по умолчанию) | true

Использование

Синтаксис

Описание

Входные аргументы

audioIn - Входной звук вектор столбца | матрица

Выходные аргументы

audioOut - Сжатый по времени звук вектор столбца | матрица

Функции объекта

Общие для всех системных объектов

Примеры

Применить изменение шкалы времени к потоковому аудио

Вход частотной области процесса

Алгоритмы

Ссылки

Расширенные возможности

Создание кода C/C + + Создайте код C и C++ с помощью MATLAB ® Coder™

См. также

Документация по панели инструментов Audio

Поддержка

`SpeedupFactor` - Коэффициент ускорения
`1.1` (по умолчанию) | положительный вещественный скаляр

`InputDomain` - Область входного сигнала
`"Time"` (по умолчанию) | `"Frequency"`

`Window` - Окно анализа
`sqrt(hann(512,'periodic'))` (по умолчанию) | реальный вектор

`OverlapLength` - Длина перекрытия соседних окон анализа
`384` (по умолчанию) | неотрицательное целое число

`FFTLength` - длина БПФ
`[]` (по умолчанию) | положительное скалярное целое

`LockPhase` - Применить блокировку фазы идентификации
`false` (по умолчанию) | `true`

`audioIn` - Входной звук
вектор столбца | матрица

`audioOut` - Сжатый по времени звук
вектор столбца | матрица

Создание кода C/C + +
Создайте код C и C++ с помощью MATLAB ® Coder™