Sound Classifier

Классифицируйте звуки на звуковой сигнал

  • Библиотека:
  • Audio Toolbox / Глубокое обучение

Описание

Блок Sound Classifier использует YAMNet, чтобы классифицировать аудио сегменты в звуковые классы, описанные онтологией AudioSet. Блок Sound Classifier комбинирует необходимую аудио предварительную обработку и вывод сети YAMNet. Блок возвращает предсказанные звуковые метки, предсказанные баллы от звуков и метки класса для предсказанных баллов.

Порты

Входной параметр

развернуть все

Звуковые данные, чтобы классифицировать в виде сигнала с одним каналом (вектор-столбец). Если Sample rate of input signal (Hz) 16e3, нет никаких ограничений на длину входного кадра. Если Sample rate of input signal (Hz) отличается от 16e3, то длина входного кадра должна быть кратной фактору децимации операции передискретизации, которую выполняет блок. Если длина входного кадра не удовлетворяет этому условию, блок выдает сообщение об ошибке с информацией о факторе децимации.

Типы данных: single | double

Вывод

развернуть все

Предсказанная звуковая метка, возвращенная как перечислимый скаляр.

Типы данных: enumerated

Предсказанная активация или значения баллов для каждой поддерживаемой звуковой метки, возвращенной как 1 521 вектор, где 521 количество классов в YAMNet.

Типы данных: single

Класс помечает для предсказанных баллов, возвращенных как 1 521 вектор.

Типы данных: enumerated

Параметры

развернуть все

Задайте частоту дискретизации входного сигнала как положительная скалярная величина в Гц. Если частота дискретизации отличается от 16e3, то блок передискретизирует сигнал к 16e3, который является частотой дискретизации это поддержки YAMNet.

Типы данных: single | double

Задайте процент перекрытия между последовательными mel спектрограммами как скаляр в области значений [0 100).

Типы данных: single | double

Включите выходному порту sound, который выводит классифицированный звук.

Включите выходным портам scores и labels, которые выводят все предсказанные баллы и сопоставленные метки класса.

Характеристики блока

Типы данных

double | single

Прямое сквозное соединение

no

Многомерные сигналы

no

Сигналы переменного размера

no

Обнаружение пересечения нулем

no

Алгоритмы

развернуть все

Алгоритм блока Sound Classifier состоит из двух шагов:

  1. Предварительная обработка – YAMNet определенная предварительная обработка. Генерирует mel спектрограммы.

  2. Предсказание – Предсказание звуков, баллов и меток входного сигнала с помощью YAMNet звучит как сеть классификации.

Расширенные возможности

Смотрите также

Приложения

Блоки

Функции

Введенный в R2021b