Закодируйте документы как матрицу количеств n-граммы или слова
Использование encode
чтобы закодировать массив маркируемых документов как, матрица слова или n-граммы рассчитывает согласно сумке слов или мешку n модели граммов. Чтобы закодировать документы как векторы или словари, используйте wordEncoding
объект.
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".counts
= encode(___,Name,Value
)
bagOfWords
| bagOfNgrams
| tfidf
| tokenizedDocument