Извлечение OpenL3 функций
возвращает OpenL3 встроенные функции с течением времени для аудиовхода embeddings = openl3Features(audioIn,fs)audioIn со скоростью дискретизации fs. Столбцы входа обрабатываются как отдельные каналы.
задает опции с использованием одного или нескольких embeddings = openl3Features(audioIn,fs,Name,Value)Name,Value аргументы. Для примера, embeddings = openl3Features(audioIn,fs,'OverlapPercentage',75) применяет 75% перекрытие между последовательными системами координат, используемыми для создания вставок звука.
Эта функция требует как Audio Toolbox™, так и Deep Learning Toolbox™.
[1] Cramer, Jason, et al. Look, Listen, and Learn More: Design Choices for Deep Audio Embeddings (неопр.) (недоступная ссылка). В ICASSP 2019 IEEE International Conference on Aoustics, Speech and Signal Processing (ICASSP), IEEE, 2019, pp. 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
audioFeatureExtractor | classifySound | openl3 | openl3Preprocess | vggish | vggishFeatures