Извлечение OpenL3 элементов
возвращает OpenL3 встраивание функций с течением времени для ввода звука embeddings = openl3Features(audioIn,fs)audioIn с частотой выборки fs. Столбцы ввода обрабатываются как отдельные каналы.
указывает параметры, использующие один или несколько embeddings = openl3Features(audioIn,fs,Name,Value)Name,Value аргументы. Например, embeddings = openl3Features(audioIn,fs,'OverlapPercentage',75) применяет 75% -ное перекрытие между последовательными кадрами, используемыми для создания вложений звука.
Эта функция требует как Toolbox™ аудио, так и Deep Learning Toolbox™.
[1] Крамер, Джейсон, и др. «Смотрите, слушайте и узнайте больше: варианты дизайна для глубоких аудиозаписей». В ICASSP 2019 Международная конференция IEEE по аустике, обработке речи и сигналов (ICASSP), IEEE, 2019, стр. 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
audioFeatureExtractor | classifySound | openl3 | openl3Preprocess | vggish | vggishFeatures