Замените N-граммы в документах
обновляет заданные документы, заменяя N-граммы newDocuments
= replaceNgrams(documents
,oldNgrams
,newNgrams
)oldNgrams
с соответствующими N-граммами в newNgrams
. Функция, по умолчанию, является чувствительной к регистру.
заменяет N-граммы newDocuments
= replaceNgrams(documents
,oldNgrams
,newNgrams
,'IgnoreCase',true)oldNgrams
'IgnoringCase' .
tokenizedDocument
| removeWords
| normalizeWords
| replaceWords
| decodeHTMLEntities