Преобразуйте документы верхнему регистру
преобразует каждый символ нижнего регистра во входных документах соответствующему символу верхнего регистра и оставляет все другие символы без изменений.newDocuments
= upper(documents
)
decodeHTMLEntities
| eraseTags
| eraseURLs
| erasePunctuation
| lower
| tokenizedDocument