Предварительная обработка аудио для OpenL3 редукции данных
задает опции с использованием одного или нескольких features
= openl3Preprocess(audioIn
,fs
,Name,Value
)Name,Value
аргументы. Для примера, features = openl3Preprocess(audioIn,fs,'OverlapPercentage',75)
применяет 75% перекрытие между последовательными системами координат, используемыми для генерации спектрограмм.
[1] Cramer, Jason, et al. Look, Listen, and Learn More: Design Choices for Deep Audio Embeddings (неопр.) (недоступная ссылка). В ICASSP 2019 IEEE International Conference on Aoustics, Speech and Signal Processing (ICASSP), IEEE, 2019, pp. 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
audioFeatureExtractor
| classifySound
| openl3
| openl3Features
| vggish
| vggishFeatures