Удалите выбранные слова из документов или модели мешка слов
удаляет указанные слова из newDocuments
= removeWords(documents
,words
)documents
. Функция по умолчанию чувствительна к регистру.
удаляет слова, игнорирующие регистр, используя любой из предыдущих синтаксисов.newDocuments
= removeWords(___,'IgnoreCase',true)
удаляет слова путем определения числовых или логических индексов newDocuments
= removeWords(documents
,idx
)idx
слов в documents.Vocabulary
. Этот синтаксис аналогичен newDocuments = removeWords(documents,documents.Vocabulary(idx))
.
bagOfNgrams
| bagOfWords
| normalizeWords
| removeEmptyDocuments
| removeInfrequentWords
| removeLongWords
| removeNgrams
| removeShortWords
| stopWords
| tokenizedDocument