Удалите пустые документы из маркируемого массива документа, модель сумки слов или мешок n модели граммов
newDocuments = removeEmptyDocuments(documents)
newBag = removeEmptyDocuments(bag)
[___,idx] = removeEmptyDocuments(___)
удаляет документы, которые не имеют никаких слов от newDocuments
= removeEmptyDocuments(documents
)documents
.
addDocument
| bagOfNgrams
| bagOfWords
| removeDocument
| tokenizedDocument