Извлеките функции OpenL3
возвращает вложения функции OpenL3 в зависимости от времени для аудиовхода embeddings = openl3Features(audioIn,fs)audioIn с частотой дискретизации fs. Столбцы входа обработаны, когда индивидуум образовывает канал.
задает опции с помощью одного или нескольких embeddings = openl3Features(audioIn,fs,Name,Value)Name,Value аргументы. Например, embeddings = openl3Features(audioIn,fs,'OverlapPercentage',75) применяется 75%-е перекрытие между последовательными системами координат раньше создавало аудио вложения.
Эта функция требует и Audio Toolbox™ и Deep Learning Toolbox™.
[1] Крамер, Джейсон, и др. "Посмотрите, Послушайте и Узнайте больше: Проектные решения для Глубоких Аудио Вложений". На международной конференции ICASSP 2019 IEEE по вопросам Акустики, Речи и Обработки сигналов (ICASSP), IEEE, 2019, стр 3852-56. DOI.org (Crossref), doi:/10.1109/ICASSP.2019.8682475.
openl3Preprocess | openl3 | vggish | classifySound | vggishFeatures | audioFeatureExtractor