Этот пример использует предварительно обученную систему распознавания динамика, 'ivec-english-16kHz'
. 'ivec-english-16kHz'
система является экземпляром ivectorSystem
обученный на наборе данных LibriSpeech.
Загрузите предварительно обученную систему распознавания динамика в свою временную директорию, местоположение которой задано MATLAB® tempdir
команда. Если вы хотите поместить файлы данных в папку, отличающуюся от tempdir
, измените имя каталога. Добавьте временную директорию в путь поиска файлов. Создайте систему i-вектора.
Считайте два речевых сигнала, каждый из которых содержит фразу "объем, на котором" говорят вслух несколько раз с различными интонациями. В одном из сигналов динамик является штекером. В другом сигнале докладчик является розеткой.
Считайте каждый сигнал и разделите его в две части. Одна из частей используется, чтобы зарегистрировать докладчика. Другая часть используется для верификации динамика и идентификации.
Зарегистрируйте докладчиков в систему распознавания динамика. Это создает шаблон динамика, который может использоваться для верификации или идентификации.
Extracting i-vectors ...done.
Enrolling i-vectors .....done.
Enrollment complete.
Вызовите identify
функция на тестовых данных.
candidates=2×2 table
Label Score
_____ _______
BF -1.0315
RD -178.77
candidates=2×2 table
Label Score
_____ _______
RD -99.188
BF -240.22
Вызовите verify
функция с тестовыми данными, чтобы подтвердить, что система правильно принимает или отклоняет динамики.
Вызовите info
функция, чтобы получить информацию о том, как модель была обучена.
Header
- This system was trained using the LibriSpeech train and development sets.
LibriSpeech is an approximately 1000-hour corpus of read English speech sampled at 16 kHz.
- The detection error tradeoff was determined by enrolling one file from each speaker in the
LibriSpeech test set, and then evaluating exhaustive pairs of the enrolled and remaining data.
i-vector system input
Input feature vector length: 60
Input data type: double
trainExtractor
Train signals: 286808
UBMNumComponents: 2048
UBMNumIterations: 10
TVSRank: 512
TVSNumIterations: 5
trainClassifier
Train signals: 286807
Train labels: 1 (91), 100043 (31) ... and 5652 more
NumEigenvectors: 200
PLDANumDimensions: 200
PLDANumIterations: 5
detectionErrorTradeoff
Evaluation signals: 5382
Evaluation labels: 102255 (46), 1066 (24) ... and 175 more
Удалите временную директорию из пути поиска файлов.