Экстрактор функции Cepstral

Извлеките функции cepstral от аудио сегмента

  • Библиотека:
  • Audio Toolbox / Измерения

Описание

Блок Cepstral Feature Extractor извлекает функции cepstral от аудио сегмента. Функции Cepstral обычно используются, чтобы охарактеризовать музыкальные сигналы и речь.

Порты

Входной параметр

развернуть все

Аудиовход к cepstral показывает экстрактор, заданный как вектор-столбец или матрица. Если задано как матрица, столбцы обработаны как независимые звуковые каналы.

Типы данных: single | double

Вывод

развернуть все

Коэффициенты Cepstral, возвращенные как вектор-столбец или матрица. Если содействующей матрицей является N-by-M матрица, N определяется значениями, которые вы задаете в параметрах Log energy usage и Number of coefficients to return. M равняется количеству входных звуковых каналов.

Когда параметр Log energy usage устанавливается на:

  • Добавление Блок предварительно ожидает логарифмическую энергетическую ценность к содействующему вектору. Длина содействующего вектора равняется 1 + NumCoeffs, где NumCoeffs является значением, заданным в параметре Number of coefficients to return.

  • Замена Блок заменяет первый коэффициент на логарифмическую энергию сигнала. Длиной содействующего вектора является NumCoeffs.

  • Ignore – Блок не вычисляет или возвращает логарифмическую энергию.

Этот порт без имени, пока вы не выбираете параметр Output delta, параметр Output delta-delta или обоих.

Типы данных: single | double

Изменитесь в коэффициентах по последовательным вызовам алгоритма, возвращенного как вектор-столбец или матрица. Массив delta одного размера и тип данных как массив coeffs.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta.

Типы данных: single | double

Изменитесь в значениях delta по последовательным вызовам алгоритма, возвращенного как вектор-столбец или матрица. Массив deltaDelta одного размера и тип данных как массивы delta и coeffs.

Зависимости

Чтобы включить этот порт, выберите параметр Output delta-delta.

Типы данных: single | double

Параметры

развернуть все

Если параметр перечислен как настраиваемый, то можно изменить его значение во время симуляции.

Тип набора фильтров, заданного или как Mel или как Gammatone:

  • Mel – Блок вычисляет частоту mel cepstral коэффициенты (MFCC).

  • Gammatone – Блок вычисляет gammatone cepstral коэффициенты (GTCC).

Настраиваемый: нет

Область входного сигнала, заданная или как Time или как Frequency.

Настраиваемый: нет

Количество коэффициентов, чтобы возвратиться, заданный как целое число в области значений [2, v], где v является количеством допустимых полос пропускания. Количество допустимых полос пропускания зависит от типа набора фильтров:

  • Mel – Количество допустимых полос пропускания задано как sum(κ <= floor(fs/2))-2, где κ является количеством ребер полосы в mel наборе фильтров, и fs является частотой дискретизации.

  • Gammatone – Количество допустимых полос пропускания задано как ceil(hz2erb(R(2))-hz2erb(R(1))), где R является частотным диапазоном gammatone набора фильтров.

Настраиваемый: нет

Типы данных: single | double

Когда вы выбираете этот параметр, длина БПФ равна количеству строк во входном сигнале.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal на Time.

Длина БПФ, заданная как положительное целое число. Значение по умолчанию, [], означает, что длина БПФ равна количеству строк во входном сигнале.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Domain of the input signal на Time и выберите параметр Inherit FFT length from input dimensions.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

Задайте, как логарифмическую энергию показывают в содействующем векторе вывод, заданный как:

  • Добавление Блок предварительно ожидает логарифмическую энергию к содействующему вектору. Длина содействующего вектора равняется 1 + NumCoeffs, где NumCoeffs является значением, заданным в параметре Number of coefficients to return.

  • Замена Блок заменяет первый коэффициент на логарифмическую энергию сигнала. Длиной содействующего вектора является NumCoeffs.

  • Ignore – Блок не вычисляет или возвращает логарифмическую энергию.

Настраиваемый: нет

Когда вы выбираете этот параметр, дополнительный выходной порт, delta, добавляется к блоку. Это выходы порта изменение в коэффициентах по последовательным вызовам алгоритма.

Настраиваемый: нет

Когда вы выбираете этот параметр, дополнительный выходной порт, deltaDelta, добавляется к блоку. Это выходы порта изменение в значениях дельты по последовательным вызовам алгоритма.

Настраиваемый: нет

Когда вы выбираете этот параметр, блок наследовал свою частоту дискретизации от входного сигнала. Когда вы очищаете этот параметр, вы задаете частоту дискретизации в параметре Input sample rate (Hz).

Настраиваемый: нет

Введите частоту дискретизации в Гц, заданном как действительная положительная скалярная величина.

Настраиваемый: да

Зависимости

Чтобы включить этот параметр, очистите параметр Inherit sample rate from input.

  • Модель Code generation - Simulate с помощью сгенерированного кода C. В первый раз, когда вы запускаете симуляцию, Simulink® генерирует код С для блока. Код С снова используется для последующих симуляций, пока модель не изменяется. Эта опция требует дополнительного времени запуска, но скорость последующих симуляций сопоставима с Interpreted execution.

  • Модель Interpreted execution - Simulate с помощью интерпретатора MATLAB®. Эта опция сокращает время запуска, но имеет более медленную скорость симуляции, чем Code generation. В этом режиме можно отладить исходный код блока.

Настраиваемый: нет

Вкладка "Дополнительно"

Частотный диапазон gammatone набора фильтров в Гц, заданном как положительное, монотонно увеличивающийся двухэлементный вектор - строка. Максимальный частотный диапазон может быть любым конечным числом. Центральные частоты набора фильтров равномерно распределены через частотный диапазон в шкале ERB.

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Gammatone.

Ребра полосы набора фильтров в Гц, заданном как неотрицательный монотонно увеличивающийся вектор - строка в области значений [0, ∞). Максимум bandedge частота может быть любым конечным числом. Количество bandedges должно быть в области значений [4, 80].

Ребра полосы по умолчанию расположены с интервалами линейно для первых десяти и затем логарифмически после этого. Ребра полосы по умолчанию установлены, как рекомендуется [1].

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Mel.

Набор фильтров Мэла разрабатывает область, заданную или как Hz или как Bin. filterbank разработан как перекрытые треугольники с ребрами полосы, заданными параметром Band edges of filter bank (Hz).

Ребра полосы заданы в Гц. Когда вы устанавливаете область проекта на:

  • Hz – Треугольники набора фильтров чертятся в Гц и сопоставлены на интервалы.

    Для получения дополнительной информации см. [1].

  • Bin – Частоты ребра полосы в Hz преобразованы в интервалы. Треугольники набора фильтров чертятся симметрично в интервалах.

    Для получения дополнительной информации см. [2].

Настраиваемый: нет

Зависимости

Чтобы включить этот параметр, установите Filter bank type на Mel.

Метод нормализации раньше нормировал веса набора фильтров, заданного как:

  • Пропускная способность Веса каждого полосового фильтра нормированы соответствующей пропускной способностью фильтра.

  • Область Веса каждого полосового фильтра нормированы соответствующей областью полосового фильтра.

  • 'none' Веса фильтра не нормированы.

Настраиваемый: нет

Характеристики блока

Типы данных

double | single

Прямое сквозное соединение

no

Многомерные сигналы

no

Сигналы переменного размера

no

Обнаружение пересечения нулем

no

Алгоритмы

развернуть все

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью Simulink® Coder™.

Введенный в R2018a

Для просмотра документации необходимо авторизоваться на сайте