Удалите короткие слова из модели сумки слов или документов
newDocuments = removeShortWords(documents,len)
newBag = removeShortWords(bag,len)
bagOfNgrams
| bagOfWords
| normalizeWords
| removeLongWords
| removeWords
| stopWords
| tokenizedDocument