Выделение признаков и глубокое обучение

Аудио маркировка, datastore, речевое обнаружение действия, MFCC, подача, громкость

Audio Toolbox™ позволяет вам извлечь слуховые функции, характерные для задач глубокого обучения и машинного обучения. Используйте Audio Labeler, чтобы в интерактивном режиме задать и визуализировать наземную истину для аудио наборов данных. Используйте audioDatastore, чтобы обработать большое количество аудиозаписей для пакетной обработки данных или машины и применения глубокого обучения.

Приложения

Audio LabelerЗадайте и визуализируйте метки наземной истины

Функции

развернуть все

audioDatastoreDatastore для набора звуковых файлов
erb2hzПреобразуйте от шкалы эквивалентной прямоугольной пропускной способности (ERB) до герц
bark2hzПреобразуйте от шкалы Коры до герц
mel2hzПреобразуйте от шкалы mel до герц
hz2erbПреобразуйте от герц до шкалы эквивалентной прямоугольной пропускной способности (ERB)
hz2barkПреобразуйте от герц, чтобы Лаять шкала
hz2melПреобразуйте от герц до шкалы mel
integratedLoudnessИзмерьте интегрированную область значений громкости и громкости
loudnessMeterСтандартно-совместимые измерения громкости
harmonicRatioГармоническое отношение
pitchОцените основную частоту звукового сигнала
voiceActivityDetectorОбнаружьте присутствие речи в звуковом сигнале
mfccИзвлеките mfcc, регистрируйте энергию, дельту и дельту дельты звукового сигнала
gtccИзвлеките gammatone cepstral коэффициенты, логарифмическая энергия, дельта и дельта дельты
cepstralFeatureExtractorИзвлеките функции cepstral от аудио сегмента
spectralCentroidСпектральный центроид для звуковых сигналов и слуховых спектрограмм
spectralCrestСпектральный гребень для звуковых сигналов и слуховых спектрограмм
spectralDecreaseСпектральное уменьшение для звуковых сигналов и слуховых спектрограмм
spectralEntropyСпектральная энтропия для звуковых сигналов и слуховых спектрограмм
spectralFlatnessСпектральная плоскость для звуковых сигналов и слуховых спектрограмм
spectralFluxСпектральный поток для звуковых сигналов и слуховых спектрограмм
spectralKurtosisСпектральный эксцесс для звуковых сигналов и слуховых спектрограмм
spectralRolloffPointСпектральная точка спада для звуковых сигналов и слуховых спектрограмм
spectralSkewnessСпектральная скошенность для звуковых сигналов и слуховых спектрограмм
spectralSlopeСпектральный наклон для звуковых сигналов и слуховых спектрограмм
spectralSpreadСпектральное распространение для звуковых сигналов и слуховых спектрограмм
melSpectrogramСпектрограмма Мэла
kbdwinОкно Kaiser-Bessel-derived
mdctИзмененное дискретное косинусное преобразование
imdctИнверсия изменила дискретное косинусное преобразование

Блоки

Voice Activity DetectorОбнаружьте присутствие речи в звуковом сигнале
Cepstral Feature ExtractorИзвлеките функции cepstral от аудио сегмента
Loudness MeterСтандартно-совместимые измерения громкости

Темы

Маркируйте Audio Using Audio Labeler

В интерактивном режиме задайте и визуализируйте метки наземной истины для аудио наборов данных

Запись речи в тексте

Выполните запись речи в тексте в MATLAB® с помощью сторонних облачных API.

Спектральные дескрипторы

Обзор и приложения спектральных дескрипторов

Популярные примеры