YAMNet

YAMNet звучат как сеть классификации

Библиотека:
Audio Toolbox / Глубокое обучение

Описание

Блок YAMNet усиливает предварительно обученную звуковую сеть классификации, которая обучена на наборе данных AudioSet, чтобы предсказать аудио события от онтологии AudioSet.

Порты

Входной параметр

развернуть все

`features` — Спектрограммы Мэла
96 64 матрица | 96 64 1 N массивом

Спектрограммы Мэла в виде 96 64 матрицы или 96 64 1 N массивом, где:

96 – Представляет количество систем координат на 10 мс в каждой mel спектрограмме
64 – Представляет количество mel полос, охватывающих от 125 Гц до 7,5 кГц
N Количество каналов.

Можно использовать блок YAMNet Preprocess, чтобы сгенерировать mel спектрограммы. Размерности этих спектрограмм 96 64.

Типы данных: single

Вывод

развернуть все

`sound` — Предсказанная звуковая метка
перечислимый скаляр

Предсказанная звуковая метка, возвращенная как перечислимый скаляр.

Типы данных: enumerated

`scores` — Предсказанные активации или баллы
вектор

Предсказанная активация или значения баллов для каждой поддерживаемой звуковой метки, возвращенной как 1 521 вектор, где 521 количество классов в YAMNet.

Типы данных: single

`labels` — Класс помечает для предсказанных баллов
вектор

Класс помечает для предсказанных баллов, возвращенных как 1 521 вектор.

Типы данных: enumerated

Параметры

развернуть все

`Mini-batch size` — Размер мини-пакетов
128 (значение по умолчанию) | положительное целое число

Размер мини-пакетов, чтобы использовать для предсказания в виде положительного целого числа. Большие мини-пакетные размеры требуют большей памяти, но могут привести к более быстрым предсказаниям.

`Classification` — Выберите, чтобы вывести звуковую классификацию
`on` (значение по умолчанию) | `off`

Включите выходному порту sound, который выводит классифицированный звук.

`Predictions` — Выведите все баллы и сопоставленные метки
`off` (значение по умолчанию) | `on`

Включите выходным портам scores и labels, которые выводят все предсказанные баллы и сопоставленные метки класса.

Примеры модели

Compare Sound Classifier block with Equivalent YAMNet blocks

Сравните блок Sound Classifier с Эквивалентными блоками YAMNet

Покажите, что блок Sound Classifier эквивалентен каскаду блока YAMNet Preprocess и блока YAMNet.

Характеристики блока

Типы данных	`double` \| `single`
Прямое сквозное соединение	`no`
Многомерные сигналы	`no`
Сигналы переменного размера	`no`
Обнаружение пересечения нулем	`no`

Алгоритмы

развернуть все

Предсказание

Блок принимает mel спектрограммы размера 96 64 или 96 64 1 N и вычисляет максимум трех выходных параметров с помощью этих спектрограмм:

звук: метка наиболее вероятного звука. Вы получаете один "звук" для каждого 96 64 вход спектрограммы.
scores: 1 512 векторы. Каждым элементом в векторе является значение баллов для каждой поддерживаемой звуковой метки.
labels: 1 521 векторы. Каждым элементом в векторе является звуковая метка.

Ссылки

[1] Gemmeke, Джортом Ф., Дэниелом П. В. Эллисом, Диланом Фридменом, не Является Янсен, Уэйд Лоуренс, Р. Ченнинг Мур, Мэнодж Плэкэл и Марвин Риттер. “Аудио Набор: Онтология и Помеченный Человеком Набор данных для Аудио Событий”. 2 017 Международных конференций IEEE по вопросам Акустики, Речи и Обработки сигналов (ICASSP), IEEE, 2017, стр 776–80. DOI.org (Crossref), doi:10.1109/ICASSP.2017.7952261.

[2] Херши, Шон, Кисловатый Chaudhuri, Дэниел П. В. Эллис, Джорт Ф. Джеммек, не Является Янсен, Р. Ченнинг Мур, Manoj Plakal, и др. “Архитектуры CNN для Крупномасштабной Аудио Классификации”. 2 017 Международных конференций IEEE по вопросам Акустики, Речи и Обработки сигналов (ICASSP), IEEE, 2017, стр 131–35. DOI.org (Crossref), doi:10.1109/ICASSP.2017.7952132.

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью Simulink® Coder™.

Указания и ограничения по применению:

Параметр Language в Configuration Parameters> Code Generation общая категория должен быть установлен на C++.
Для основанных на ERT целей параметра Support: variable-size signals в Code Generation> должна быть включена панель Interface.
Для списка сетей и слоев, поддержанных для генерации кода, смотрите Сети и Слои, Поддержанные для Генерации кода (MATLAB Coder).

Смотрите также

Введенный в R2021b

Документация

YAMNet

Описание

Порты

Входной параметр

`features` — Спектрограммы Мэла
96 64 матрица | 96 64 1 N массивом

Вывод

`sound` — Предсказанная звуковая метка
перечислимый скаляр

`scores` — Предсказанные активации или баллы
вектор

`labels` — Класс помечает для предсказанных баллов
вектор

Параметры

`Mini-batch size` — Размер мини-пакетов
128 (значение по умолчанию) | положительное целое число

`Classification` — Выберите, чтобы вывести звуковую классификацию
`on` (значение по умолчанию) | `off`

`Predictions` — Выведите все баллы и сопоставленные метки
`off` (значение по умолчанию) | `on`

Примеры модели

Сравните блок Sound Classifier с Эквивалентными блоками YAMNet

Характеристики блока

Алгоритмы

Предсказание

Ссылки

Расширенные возможности

Генерация кода C/C++
Генерация кода C и C++ с помощью Simulink® Coder™.

Смотрите также

Приложения

Блоки

Функции

Документация Audio Toolbox

Поддержка

Документация

YAMNet

Описание

Порты

Входной параметр

features — Спектрограммы Мэла 96 64 матрица | 96 64 1 N массивом

Вывод

sound — Предсказанная звуковая метка перечислимый скаляр

scores — Предсказанные активации или баллы вектор

labels — Класс помечает для предсказанных баллов вектор

Параметры

Mini-batch size — Размер мини-пакетов128 (значение по умолчанию) | положительное целое число

Classification — Выберите, чтобы вывести звуковую классификацию on (значение по умолчанию) | off

Predictions — Выведите все баллы и сопоставленные метки off (значение по умолчанию) | on

Примеры модели

Сравните блок Sound Classifier с Эквивалентными блоками YAMNet

Характеристики блока

Алгоритмы

Предсказание

Ссылки

Расширенные возможности

Генерация кода C/C++ Генерация кода C и C++ с помощью Simulink® Coder™.

Смотрите также

Приложения

Блоки

Функции

Документация Audio Toolbox

Поддержка

`features` — Спектрограммы Мэла
96 64 матрица | 96 64 1 N массивом

`sound` — Предсказанная звуковая метка
перечислимый скаляр

`scores` — Предсказанные активации или баллы
вектор

`labels` — Класс помечает для предсказанных баллов
вектор

`Mini-batch size` — Размер мини-пакетов
128 (значение по умолчанию) | положительное целое число

`Classification` — Выберите, чтобы вывести звуковую классификацию
`on` (значение по умолчанию) | `off`

`Predictions` — Выведите все баллы и сопоставленные метки
`off` (значение по умолчанию) | `on`

Генерация кода C/C++
Генерация кода C и C++ с помощью Simulink® Coder™.