replaceWords

Замените слова в документах

Описание

пример

newDocuments = replaceWords(documents,oldWords,newWords) обновляет заданные документы, заменяя слова в oldWords с соответствующими словами в newWords. Функция, по умолчанию, является чувствительной к регистру.

newDocuments = replaceWords(documents,oldWords,newWords,'IgnoreCase',true) заменяет слова в oldWords 'IgnoringCase' .

Примеры

свернуть все

Используйте replaceWords функционируйте, чтобы заменить краткие слова на их соответствующие полные слова.

Создайте массив маркируемых документов.

str = [ ...
    "Increased activity Mon to Fri."
    "Reduced activity Sat to Sun."];
documents = tokenizedDocument(str)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Mon to Fri .
    6 tokens: Reduced activity Sat to Sun .

Замените краткие слова на их соответствующие полные слова.

oldWords = ["Mon" "Tue" "Wed" "Thu" "Fri" "Sat" "Sun"];
newWords = ["Monday" "Tuesday" "Wednesday" "Thursday" "Friday" "Saturday" "Sunday"];
documents = replaceWords(documents,oldWords,newWords)
documents = 
  2x1 tokenizedDocument:

    6 tokens: Increased activity Monday to Friday .
    6 tokens: Reduced activity Saturday to Sunday .

Входные параметры

свернуть все

Введите документы в виде tokenizedDocument массив.

Слова, чтобы заменить в виде массива строк, вектора символов или массива ячеек из символьных векторов.

Типы данных: string | char | cell

Новые слова в виде массива строк, вектора символов или массива ячеек из символьных векторов.

newWords должен содержать одно слово или быть одного размера с oldWords. Если newWords содержит только одно слово, затем функция заменяет все слова в oldWords с этим словом.

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Выведите документы, возвращенные как tokenizedDocument массив.

Советы

  • Заменять слова в документах путем определения pattern массивы, используйте replace функция.

Введенный в R2019a