Извлечение OpenL3 функций
возвращает OpenL3 встроенные функции с течением времени для аудиовхода embeddings
= openl3Features(audioIn
,fs
)audioIn
со скоростью дискретизации fs
. Столбцы входа обрабатываются как отдельные каналы.
задает опции с использованием одного или нескольких embeddings
= openl3Features(audioIn
,fs
,Name,Value
)Name,Value
аргументы. Для примера, embeddings = openl3Features(audioIn,fs,'OverlapPercentage',75)
применяет 75% перекрытие между последовательными системами координат, используемыми для создания вставок звука.
Эта функция требует как Audio Toolbox™, так и Deep Learning Toolbox™.
[1] Cramer, Jason, et al. Look, Listen, and Learn More: Design Choices for Deep Audio Embeddings (неопр.) (недоступная ссылка). В ICASSP 2019 IEEE International Conference on Aoustics, Speech and Signal Processing (ICASSP), IEEE, 2019, pp. 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
audioFeatureExtractor
| classifySound
| openl3
| openl3Preprocess
| vggish
| vggishFeatures