Преобразуйте документы верхнему регистру
преобразует каждый символ нижнего регистра во входных документах соответствующему символу верхнего регистра и оставляет все другие символы без изменений.newDocuments = upper(documents)
decodeHTMLEntities | eraseTags | eraseURLs | erasePunctuation | lower | tokenizedDocument