Большинство важных слов в модели сумки слов или теме LDA
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".tbl
= topkwords(___,Name,Value
)
Чтобы найти наиболее часто замечаемые N-граммы в мешке n модели граммов, использовать topkngrams
.
bagOfWords
| bagOfNgrams
| removeInfrequentWords
| removeWords
| topkngrams
| tfidf
| ldaModel
| tokenizedDocument