Предварительно обработайте аудио для извлечения признаков VGGish
задает процент перекрытия между последовательными аудио системами координат.features
= vggishPreprocess(audioIn
,fs
,'OverlapPercentage'
,OP
)
Например, vggishPreprocess(audioIn,fs,'OverlapPercentage',75)
применяется 75%-е перекрытие между последовательными системами координат раньше генерировало спектрограммы.
[1] Gemmeke, Джорт Ф., и др. “Аудио Набор: Онтология и Помеченный Человеком Набор данных для Аудио Событий”. 2 017 Международных конференций IEEE по вопросам Акустики, Речи и Обработки сигналов (ICASSP), IEEE, 2017, стр 776–80. DOI.org (Crossref), doi:10.1109/ICASSP.2017.7952261.
[2] Херши, Шон, и др. “Архитектуры CNN для Крупномасштабной Аудио Классификации”. 2 017 Международных конференций IEEE по вопросам Акустики, Речи и Обработки сигналов (ICASSP), IEEE, 2017, стр 131–35. DOI.org (Crossref), doi:10.1109/ICASSP.2017.7952132.