Если ваши текстовые данные содержатся в нескольких файлах в папке, то можно импортировать текстовые данные и создать модель сумки слов в параллели с помощью parfor
. Если вам установили Parallel Computing Toolbox™, то цикл parfor
запускается параллельно, в противном случае, это запускается в сериале. Используйте join
, чтобы объединить массив моделей сумки слов в одну модель.
Создайте модель сумки слов из набора файлов. Сонеты в качестве примера имеют имена файлов "exampleSonnetN.txt
", где N
является количеством сонета. Получите список файлов и их местоположений с помощью dir
.
fileInfo = 5x1 struct array with fields:
name
folder
date
bytes
isdir
datenum
Инициализируйте пустую модель сумки слов и затем цикл по файлам и создайте массив моделей сумки слов.
Starting parallel pool (parpool) using the 'local' profile ...
Connected to the parallel pool (number of workers: 12).
Объедините модели сумки слов с помощью join
.
bag =
bagOfWords with properties:
Counts: [5x3275 double]
Vocabulary: [1x3275 string]
NumWords: 3275
NumDocuments: 5