Замените n-граммы в документах
обновляет указанные документы путем замены n-граммов newDocuments
= replaceNgrams(documents
,oldNgrams
,newNgrams
)oldNgrams
с соответствующими n-граммами в newNgrams
. Функция по умолчанию чувствительна к регистру.
заменяет n-граммы newDocuments
= replaceNgrams(documents
,oldNgrams
,newNgrams
,'IgnoreCase',true)oldNgrams
игнорирование случая.
decodeHTMLEntities
| normalizeWords
| removeWords
| replaceWords
| tokenizedDocument