exponenta event banner

replaceWords

Заменить слова в документах

Описание

пример

newDocuments = replaceWords(documents,oldWords,newWords) обновляет указанные документы путем замены слов в oldWords с соответствующими словами в newWords. Функция по умолчанию чувствительна к регистру.

newDocuments = replaceWords(documents,oldWords,newWords,'IgnoreCase',true) заменяет слова в oldWords игнорирование случая.

Примеры

свернуть все

Используйте replaceWords функция замены сокращенных слов на соответствующие им полные слова.

Создание массива маркированных документов.

str = [ ...
    "Increased activity Mon to Fri."
    "Reduced activity Sat to Sun."];
documents = tokenizedDocument(str)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Mon to Fri .
    6 tokens: Reduced activity Sat to Sun .

Замените сокращенные слова соответствующими полными словами.

oldWords = ["Mon" "Tue" "Wed" "Thu" "Fri" "Sat" "Sun"];
newWords = ["Monday" "Tuesday" "Wednesday" "Thursday" "Friday" "Saturday" "Sunday"];
documents = replaceWords(documents,oldWords,newWords)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Monday to Friday .
    6 tokens: Reduced activity Saturday to Sunday .

Входные аргументы

свернуть все

Исходные документы, указанные как tokenizedDocument массив.

Заменяемые слова, указанные как строковый массив, символьный вектор или массив ячеек символьных векторов.

Типы данных: string | char | cell

Новые слова, указанные как строковый массив, символьный вектор или массив ячеек символьных векторов.

newWords должно содержать одно слово или быть того же размера, что и oldWords. Если newWords содержит только одно слово, затем функция заменяет все слова в oldWords с этим словом.

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Выходные документы, возвращенные как tokenizedDocument массив.

Совет

  • Замена слов в документах путем указания pattern массивы, используйте replace функция.

Представлен в R2019a