Предварительная обработка аудио для OpenL3 редукции данных
задает опции с использованием одного или нескольких features = openl3Preprocess(audioIn,fs,Name,Value)Name,Value аргументы. Для примера, features = openl3Preprocess(audioIn,fs,'OverlapPercentage',75) применяет 75% перекрытие между последовательными системами координат, используемыми для генерации спектрограмм.
[1] Cramer, Jason, et al. Look, Listen, and Learn More: Design Choices for Deep Audio Embeddings (неопр.) (недоступная ссылка). В ICASSP 2019 IEEE International Conference on Aoustics, Speech and Signal Processing (ICASSP), IEEE, 2019, pp. 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
audioFeatureExtractor | classifySound | openl3 | openl3Features | vggish | vggishFeatures