replaceWords

Заменить слова в документах

Описание

пример

newDocuments = replaceWords(documents,oldWords,newWords) обновляет указанные документы путем замены слов в oldWords с соответствующими словами в newWords. Функция по умолчанию чувствительна к регистру.

newDocuments = replaceWords(documents,oldWords,newWords,'IgnoreCase',true) заменяет слова в oldWords игнорирование случая.

Примеры

свернуть все

Используйте replaceWords функция для замены кратких слов на соответствующие им полные слова.

Создайте массив токенизированных документов.

str = [ ...
    "Increased activity Mon to Fri."
    "Reduced activity Sat to Sun."];
documents = tokenizedDocument(str)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Mon to Fri .
    6 tokens: Reduced activity Sat to Sun .

Замените краткие слова соответствующими полными словами.

oldWords = ["Mon" "Tue" "Wed" "Thu" "Fri" "Sat" "Sun"];
newWords = ["Monday" "Tuesday" "Wednesday" "Thursday" "Friday" "Saturday" "Sunday"];
documents = replaceWords(documents,oldWords,newWords)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Monday to Friday .
    6 tokens: Reduced activity Saturday to Sunday .

Входные параметры

свернуть все

Входные документы, заданные как tokenizedDocument массив.

Слова для замены, заданные как строковые массивы, вектор символов или массив ячеек векторов символов.

Типы данных: string | char | cell

Новые слова, заданные как строковые массивы, вектор символов или массив ячеек векторов символов.

newWords должно содержать одно слово или иметь тот же размер oldWords. Если newWords содержит только одно слово, затем функция заменяет все слова в oldWords с этим словом.

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Выходные документы, возвращенные как tokenizedDocument массив.

Совет

  • Заменить слова в документах указанием pattern массивы, использовать replace функция.

Введенный в R2019a