Преобразовать документы в верхний регистр
преобразует каждый строчный символ во входных документах в соответствующий верхний регистр и оставляет все остальные символы неизменными.newDocuments = upper(documents)
decodeHTMLEntities | erasePunctuation | eraseTags | eraseURLs | lower | tokenizedDocument