Преобразование документов в заглавные
преобразует каждый строчный символ во входных документах в соответствующий верхний символ и оставляет все остальные символы без изменений.newDocuments
= upper(documents
)
decodeHTMLEntities
| erasePunctuation
| eraseTags
| eraseURLs
| lower
| tokenizedDocument