Извлечение признаков и глубокое обучение

Аудио маркировка, datastore, речевое обнаружение действия, MFCC, подача, громкость

Audio Toolbox™ позволяет вам извлечь слуховые функции, характерные для задач глубокого обучения и машинного обучения. Используйте Audio Labeler, чтобы в интерактивном режиме задать и визуализировать основную истину для аудио наборов данных. Используйте audioDatastore обрабатывать большое количество аудиозаписей для приложений пакетной обработки данных или машинного и глубокого обучения.

Приложения

Audio LabelerЗадайте и визуализируйте метки основной истины

Функции

развернуть все

audioDatastoreDatastore для набора звуковых файлов
mfccИзвлеките mfcc, регистрируйте энергию, дельту и дельту дельты звукового сигнала
gtccИзвлеките gammatone cepstral коэффициенты, логарифмическая энергия, дельта и дельта дельты
cepstralFeatureExtractorИзвлеките функции cepstral из аудио сегмента
audioDataAugmenterУвеличьте аудиоданные
audioTimeScalerПримените время, масштабируясь к передаче потокового аудио
shiftPitchПереключите аудио подачу
stretchAudioРастяните аудио во времени
erb2hzПреобразуйте от шкалы эквивалентной прямоугольной пропускной способности (ERB) до герц
bark2hzПреобразуйте от шкалы Коры до герц
mel2hzПреобразуйте от шкалы mel до герц
hz2erbПреобразуйте от герц до шкалы эквивалентной прямоугольной пропускной способности (ERB)
hz2barkПреобразуйте от герц, чтобы Лаять шкала
hz2melПреобразуйте от герц до шкалы mel
designAuditoryFilterBankСпроектируйте слуховой набор фильтров
integratedLoudnessИзмерьте интегрированную область значений громкости и громкости
loudnessMeterСтандартно-совместимые измерения громкости
harmonicRatioГармоническое отношение
pitchОцените основную частоту звукового сигнала
voiceActivityDetectorОбнаружьте присутствие речи в звуковом сигнале
audioFeatureExtractorОптимальная экстракция функции аудио
spectralCentroidСпектральный центроид для звуковых сигналов и слуховых спектрограмм
spectralCrestСпектральный гребень для звуковых сигналов и слуховых спектрограмм
spectralDecreaseСпектральное уменьшение для звуковых сигналов и слуховых спектрограмм
spectralEntropyСпектральная энтропия для звуковых сигналов и слуховых спектрограмм
spectralFlatnessСпектральная плоскость для звуковых сигналов и слуховых спектрограмм
spectralFluxСпектральный поток для звуковых сигналов и слуховых спектрограмм
spectralKurtosisСпектральный эксцесс для звуковых сигналов и слуховых спектрограмм
spectralRolloffPointСпектральная точка спада для звуковых сигналов и слуховых спектрограмм
spectralSkewnessСпектральная скошенность для звуковых сигналов и слуховых спектрограмм
spectralSlopeСпектральный наклон для звуковых сигналов и слуховых спектрограмм
spectralSpreadСпектральное распространение для звуковых сигналов и слуховых спектрограмм
melSpectrogramСпектрограмма Мэла
kbdwinОкно Kaiser-Bessel-derived
mdctМодифицированное дискретное косинусное преобразование
imdctИнверсия изменила дискретное косинусное преобразование

Блоки

Voice Activity DetectorОбнаружьте присутствие речи в звуковом сигнале
Cepstral Feature ExtractorИзвлеките функции cepstral из аудио сегмента
Loudness MeterСтандартно-совместимые измерения громкости

Темы

Маркируйте Audio Using Audio Labeler

В интерактивном режиме задайте и визуализируйте метки основной истины для аудио наборов данных.

Запись речи в тексте

Выполните запись речи в тексте в MATLAB® с помощью сторонних облачных API.

Спектральные дескрипторы

Обзор и приложения спектральных дескрипторов.

Рекомендуемые примеры