Cepstral Feature Extractor

Извлечение функций cepstral из сегмента audio

  • Библиотека:
  • Audio измерения

  • Cepstral Feature Extractor block

Описание

Блок Cepstral Feature Extractor извлекает функции cepstral из аудиосегмента. Функции Cepstral обычно используются для характеристики речевых и музыкальных сигналов.

Порты

Вход

расширить все

Аудио вход в cepstral функции extractor, заданный как вектор-столбец или матрица. Если задано в виде матрицы, столбцы обрабатываются как независимые аудиоканалы.

Типы данных: single | double

Выход

расширить все

Коэффициенты Cepstral, возвращенные как вектор-столбец или матрица. Если матрица коэффициентов является матрицей N -by - M, N определяется значениями, которые вы задаете в параметрах Number of coefficients to return и Log energy usage. M равняется количеству входа аудиоканалов.

Когда параметр Log energy usage установлен в:

  • Append - Блок подготавливает значение энергии журнала к вектору коэффициентов. Длина вектора коэффициентов 1 + NumCoeffs, где NumCoeffs - значение, заданное в параметре Number of coefficients to return.

  • Replace - Блок заменяет первый коэффициент на журнал энергию сигнала. Длина вектора коэффициентов NumCoeffs.

  • Ignore -- Блок не вычисляет и не возвращает журнала энергию.

Этот порт не называется, пока вы не выберете Output delta параметр, параметр Output delta-delta или оба.

Типы данных: single | double

Изменение коэффициентов во время последовательных вызовов алгоритма, возвращаемое как вектор-столбец или матрица. Массив delta имеет тот же размер и тип данных, что и массив coeffs.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta.

Типы данных: single | double

Изменение значений delta во время последовательных вызовов алгоритма, возвращаемое как вектор-столбец или матрица. Массив deltaDelta имеет тот же размер и тип данных, что и coeffs и delta массивы.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta-delta.

Типы данных: single | double

Параметры

расширить все

Если параметр указан как настраиваемый, то можно изменить его значение во время симуляции.

Тип группы фильтров, заданный как Mel или Gammatone:

  • Mel - Блок вычисляет коэффициенты mel frequency cepstral (MFCC).

  • Gammatone - Блок вычисляет коэффициенты gammatone cepstral (GTCC).

Настраиваемый: Нет

Область входного сигнала, заданная как Time или Frequency.

Настраиваемый: Нет

Количество возвращаемых коэффициентов, заданное в виде целого числа в области значений [2, v], где v количество допустимых полос пропускания. Количество допустимых полос пропускания зависит от типа банка фильтров:

  • Mel - Количество допустимых полос пропускания определяется как sum(κ <= floor(fs/2))-2, где κ количество ребер полосы пропускания в mel filter bank и fs - частота дискретизации.

  • Gammatone - Количество допустимых полос пропускания определяется как ceil (hz2erb(R (2)) -hz2erb(R (1))), где R - частотная область значений группы гамматоновых фильтров.

Настраиваемый: Нет

Типы данных: single | double

Тип нелинейного выпрямления, применяемого до дискретного косинусного преобразования.

Настраиваемый: Нет

Когда вы выбираете этот параметр, длина БПФ равна количеству строк в входном сигнале.

Настраиваемый: Нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal равным Time.

Длина БПФ, заданная как положительное целое число. Значение по умолчанию, [], означает, что длина БПФ равна количеству строк в входном сигнале.

Настраиваемый: Нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal равным Time и выберите параметр Inherit FFT length from input dimensions.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

Задайте, как энергия журнала показана в выходе вектора коэффициентов, заданном как:

  • Append - Блок подготавливает энергию журнала к вектору коэффициентов. Длина вектора коэффициентов 1 + NumCoeffs, где NumCoeffs - значение, заданное в параметре Number of coefficients to return.

  • Replace - Блок заменяет первый коэффициент на журнал энергию сигнала. Длина вектора коэффициентов NumCoeffs.

  • Ignore -- Блок не вычисляет и не возвращает журнала энергию.

Настраиваемый: Нет

Когда вы выбираете этот параметр, к блоку добавляется дополнительный выходной порт, delta. Этот порт выводит изменение коэффициентов на последовательные вызовы алгоритма.

Настраиваемый: Нет

Когда вы выбираете этот параметр, к блоку добавляется дополнительный выходной порт, deltaDelta. Этот порт выводит изменение значений дельты во время последовательных вызовов алгоритма.

Настраиваемый: Нет

Когда вы выбираете этот параметр, блок наследует свою частоту дискретизации от входного сигнала. Когда вы очищаете этот параметр, вы задаете частоту дискретизации в Input sample rate (Hz) параметре.

Настраиваемый: Нет

Входная частота выборки в Гц, заданная как действительная положительная скалярная величина.

Зависимости

Чтобы включить этот параметр, очистите параметр Inherit sample rate from input.

  • Code generation - Симулируйте модель с использованием сгенерированного кода C. Первый раз, когда вы запускаете симуляцию, Simulink® генерирует код С для блока. Код С повторно используется для последующих симуляций, пока модель не меняется. Эта опция требует дополнительного времени запуска, но скорость последующих симуляций сопоставима с Interpreted execution.

  • Interpreted execution -- Моделируйте модель с помощью MATLAB® интерпретатор. Эта опция сокращает время запуска, но имеет более низкую скорость симуляции, чем Code generation. В этом режиме можно отлаживать исходный код блока.

Настраиваемый: Нет

Вкладка «Дополнительно»

Частотная область значений группы гамматоновых фильтров в Гц, заданная как положительная, монотонно увеличивающаяся двухэлементный вектор-строка. Максимальная частотная область значений может быть любым конечным числом. Центральные частоты группы фильтров равномерно разнесены по частотной области значений по шкале ERB.

Настраиваемый: Нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type равным Gammatone.

Края полосы ребер группы фильтров в Гц, заданные как неотрицательный монотонно увеличивающийся вектор-строка в области значений [0, ∞). Максимальная частота полосы пропускания может быть любым конечным числом. Количество полос пропускания должно быть в области значений [4, 80].

Диапазонные ребра по умолчанию разнесены линейно для первой десятки, а затем логарифмически после этого. Полосы ребер по умолчанию заданы как рекомендуемые [1].

Настраиваемый: Нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type равным Mel.

Область проекта банка Мел-фильтров, заданная как Hz или Bin. Банк фильтров разработан как перекрывающиеся треугольники с ребрами полосы, заданными параметром Band edges of filter bank (Hz).

Ребра полосы данных указаны в Гц. Когда вы устанавливаете область проекта на:

  • Hz - треугольники банка фильтров рисуются в Гц и отображаются на интервалы.

    Для получения дополнительной информации см. раздел [1].

  • Bin -- Частоты ребра полосы в Hz преобразуются в интервалы. Треугольники банка фильтров рисуются симметрично в интервалах.

    Для получения дополнительной информации см. раздел [2].

Настраиваемый: Нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type равным Mel.

Метод нормализации для нормализации весов группы фильтров, заданный как:

  • Bandwidth - Веса каждого полосного фильтра нормированы соответствующей полосой пропускания фильтра.

  • Area - Веса каждого полосно-пропускающего фильтра нормированы соответствующей площадью полосно-пропускающего фильтра.

  • None - Веса фильтра не нормированы.

Настраиваемый: Нет

Характеристики блоков

Типы данных

double | single

Прямое сквозное соединение

no

Многомерные сигналы

no

Сигналы переменного размера

no

Обнаружение пересечения нулем

no

Алгоритмы

расширить все

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ Simulink ®

.
Введенный в R2018a
Для просмотра документации необходимо авторизоваться на сайте