Удалите длинные слова из модели сумки слов или документов
newDocuments = removeLongWords(documents,len)
newBag = removeLongWords(bag,len)
bagOfNgrams
| bagOfWords
| normalizeWords
| removeShortWords
| removeStopWords
| removeWords
| stopWords
| tokenizedDocument