Преобразуйте документы нижнему регистру
newDocuments = lower(documents) преобразовывает каждый символ верхнего регистра во входных документах соответствующему символу нижнего регистра и оставляет все другие символы без изменений.newDocuments = lower(documents)
decodeHTMLEntities | erasePunctuation | eraseTags | eraseURLs | tokenizedDocument | upper