Cepstral Feature Extractor

Извлеките функции cepstral из аудио сегмента

  • Библиотека:
  • Audio Toolbox / Измерения

  • Cepstral Feature Extractor block

Описание

Блок Cepstral Feature Extractor извлекает функции cepstral из аудио сегмента. Функции Cepstral обычно используются, чтобы охарактеризовать музыкальные сигналы и речь.

Порты

Входной параметр

развернуть все

Аудиовход к cepstral показывает экстрактор в виде вектор-столбца или матрицы. Если задано как матрица, столбцы обработаны как независимые звуковые каналы.

Типы данных: single | double

Вывод

развернуть все

Коэффициенты Cepstral, возвращенные как вектор-столбец или матрица. Если содействующей матрицей является N-by-M матрица, N определяется значениями, которые вы задаете в параметрах Log energy usage и Number of coefficients to return. M равняется количеству входных звуковых каналов.

Когда параметр Log energy usage устанавливается на:

  • Append – Блок предварительно ожидает логарифмическую энергетическую ценность к содействующему вектору. Длина содействующего вектора равняется 1 + NumCoeffs, где NumCoeffs является значением, заданным в параметре Number of coefficients to return.

  • Replace – Блок заменяет первый коэффициент на логарифмическую энергию сигнала. Длиной содействующего вектора является NumCoeffs.

  • Ignore – Блок не вычисляет или возвращает логарифмическую энергию.

Этот порт без имени, пока вы не выбираете параметр Output delta, параметр Output delta-delta или обоих.

Типы данных: single | double

Изменитесь в коэффициентах по последовательным вызовам алгоритма, возвращенного как вектор-столбец или матрица. Массив delta одного размера и тип данных как массив coeffs.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta.

Типы данных: single | double

Изменитесь в значениях delta по последовательным вызовам алгоритма, возвращенного как вектор-столбец или матрица. Массив deltaDelta одного размера и тип данных с массивами delta и coeffs.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta-delta.

Типы данных: single | double

Параметры

развернуть все

Если параметр перечислен как настраиваемый, то можно изменить его значение в процессе моделирования.

Тип набора фильтров в виде любого Mel или Gammatone:

  • Mel – Блок вычисляет частоту mel cepstral коэффициенты (MFCC).

  • Gammatone – Блок вычисляет gammatone cepstral коэффициенты (GTCC).

Настраиваемый: нет

Область входного сигнала в виде любого Time или Frequency.

Настраиваемый: нет

Количество коэффициентов, чтобы возвратиться в виде целого числа в области значений [2, v], где v является количеством допустимых полос пропускания. Количество допустимых полос пропускания зависит от типа набора фильтров:

  • Mel – Количество допустимых полос пропускания задано как sum(κ <= floor(fs/2))-2, где κ количество ребер полосы в mel наборе фильтров и fs частота дискретизации.

  • Gammatone – Количество допустимых полос пропускания задано, как перекрывают (hz2erbr2 -hz2erbR1 , где R частотный диапазон gammatone набора фильтров.

Настраиваемый: нет

Типы данных: single | double

Тип нелинейного исправления применяется до дискретного косинусного преобразования.

Настраиваемый: нет

Когда вы выбираете этот параметр, длина БПФ равна количеству строк во входном сигнале.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal на Time.

Длина БПФ в виде положительного целого числа. Значение по умолчанию, [], средние значения, что длина БПФ равна количеству строк во входном сигнале.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal на Time и выберите параметр Inherit FFT length from input dimensions.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

Задайте, как логарифмическую энергию показывают в содействующем векторе выход в виде:

  • Append – Блок предварительно ожидает логарифмическую энергию к содействующему вектору. Длина содействующего вектора равняется 1 + NumCoeffs, где NumCoeffs является значением, заданным в параметре Number of coefficients to return.

  • Replace – Блок заменяет первый коэффициент на логарифмическую энергию сигнала. Длиной содействующего вектора является NumCoeffs.

  • Ignore – Блок не вычисляет или возвращает логарифмическую энергию.

Настраиваемый: нет

Когда вы выбираете этот параметр, дополнительный выходной порт, delta, добавляется к блоку. Это выходы порта изменение в коэффициентах по последовательным вызовам алгоритма.

Настраиваемый: нет

Когда вы выбираете этот параметр, дополнительный выходной порт, deltaDelta, добавляется к блоку. Это выходы порта изменение в значениях дельты по последовательным вызовам алгоритма.

Настраиваемый: нет

Когда вы выбираете этот параметр, блок наследовал свою частоту дискретизации от входного сигнала. Когда вы очищаете этот параметр, вы задаете частоту дискретизации в параметре Input sample rate (Hz).

Настраиваемый: нет

Введите частоту дискретизации в Гц в виде действительной положительной скалярной величины.

Зависимости

Чтобы включить этот параметр, очистите параметр Inherit sample rate from input.

  • Code generation – Симулируйте модель с помощью сгенерированного кода C. В первый раз вы запускаете симуляцию, Simulink® генерирует код С для блока. Код С снова используется для последующих симуляций, пока модель не изменяется. Эта опция требует дополнительного времени запуска, но скорость последующих симуляций сопоставима с Interpreted execution.

  • Interpreted execution – Симулируйте модель с помощью MATLAB® интерпретатор. Эта опция сокращает время запуска, но имеет более медленную скорость симуляции, чем Code generation. В этом режиме можно отладить исходный код блока.

Настраиваемый: нет

Вкладка "Дополнительно"

Частотный диапазон gammatone набора фильтров в Гц в виде положительного, монотонно увеличивающегося двухэлементного вектора-строки. Максимальный частотный диапазон может быть любым конечным числом. Центральные частоты набора фильтров равномерно распределены через частотный диапазон по шкале ERB.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Gammatone.

Ребра полосы набора фильтров в Гц в виде неотрицательного монотонно увеличивающегося вектора-строки в области значений [0, ∞). Максимум bandedge частота может быть любым конечным числом. Количество bandedges должно быть в области значений [4, 80].

Ребра полосы по умолчанию расположены с интервалами линейно для первых десяти и затем логарифмически после этого. Ребра полосы по умолчанию установлены, как рекомендуется [1].

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Mel.

Набор фильтров Мэла проектирует область в виде любого Hz или Bin. Набор фильтров спроектирован как перекрытые треугольники с ребрами полосы, заданными параметром Band edges of filter bank (Hz).

Ребра полосы заданы в Гц. Когда вы устанавливаете область проекта на:

  • Hz – Треугольники набора фильтров чертятся в Гц и сопоставлены на интервалы.

    Для получения дополнительной информации см. [1].

  • Bin – Частоты ребра полосы в Hz преобразованы в интервалы. Треугольники набора фильтров чертятся симметрично в интервалах.

    Для получения дополнительной информации см. [2].

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Mel.

Метод нормализации раньше нормировал веса набора фильтров в виде:

  • Bandwidth – Веса каждого полосового фильтра нормированы на соответствующую полосу пропускания фильтра.

  • Area – Веса каждого полосового фильтра нормированы на соответствующую область полосового фильтра.

  • None – Веса фильтра не нормированы.

Настраиваемый: нет

Характеристики блока

Типы данных

double | single

Прямое сквозное соединение

no

Многомерные сигналы

no

Сигналы переменного размера

no

Обнаружение пересечения нулем

no

Алгоритмы

развернуть все

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью Simulink® Coder™.

Введенный в R2018a
Для просмотра документации необходимо авторизоваться на сайте