Предварительная обработка аудио для редукции данных VGGish
задает процент перекрытия между последовательными аудио систем координат.features
= vggishPreprocess(audioIn
,fs
,'OverlapPercentage'
,OP
)
Для примера, vggishPreprocess(audioIn,fs,'OverlapPercentage',75)
применяет 75% перекрытие между последовательными системами координат, используемыми для генерации спектрограмм.
[1] Gemmeke, Jort F., et al. «Audio Set: An Ontology and Human-Labeled Dataset for Audio Events». 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2017, pp. 776-80. DOI.org (Crossref), doi: 10.1109/ICASSP.2017.7952261.
[2] Hershey, Shawn, et al. «Архитектуры CNN для Крупномасштабной Аудио Классификации». Международная конференция IEEE 2017 года по вопросам Акустики, Речи и Сигнала, Обрабатывающего (ICASSP), IEEE, 2017, стр 131-35. DOI.org (Crossref), doi:10.1109/ICASSP.2017.7952132.