Замените слова в документах
обновляет заданные документы, заменяя слова в newDocuments
= replaceWords(documents
,oldWords
,newWords
)oldWords
с соответствующими словами в newWords
.
decodeHTMLEntities
| normalizeWords
| replaceNgrams
| tokenizedDocument