Замените слова в документах
newDocuments = replaceWords(documents,oldWords,newWords)
обновляет заданные документы, заменяя слова в newDocuments
= replaceWords(documents
,oldWords
,newWords
)oldWords
с соответствующими словами в newWords
.
decodeHTMLEntities
| normalizeWords
| replaceNgrams
| tokenizedDocument