docfun

Примените функцию к словам в документах

Синтаксис

newDocuments = docfun(func,documents)

newDocuments = docfun(func,documents1,...,documentsN)

Описание

newDocuments = docfun(func,documents) вызывает функцию, заданную указателем на функцию func и элементы передач documents как вектор строки из слов.

Если func принимает точно один входной параметр, затем слова newDocuments(i) выход func(string(documents(i))).
Если func принимает два входных параметра, затем слова newDocuments(i) выход func(string(documents(i)),details), где details содержит соответствующие маркерные детали, выведенные tokenDetails.
Если func изменяет количество слов в документе, затем docfun удаляет маркерные детали из того документа.

docfun не выполняет вызовы функционального func в определенном порядке.

пример

newDocuments = docfun(func,documents1,...,documentsN) вызывает функцию, заданную указателем на функцию func и элементы передач documents1,…,documentsN как представляют векторы в виде строки из слов, где N является количеством входных параметров к функциональному func. Слова newDocuments(i) выход func(string(documents1(i)),...,string(documentsN(i))).

Каждый documents1,…,documentsN должен быть одного размера.

Примеры

свернуть все

Противоположные слова в документах

Скрипт Open Live Script

Примените reverse к каждому слову в массиве документа.

documents = tokenizedDocument([ ...
    "an example of a short sentence" 
    "a second short sentence"])

documents = 
  2x1 tokenizedDocument:

    6 tokens: an example of a short sentence
    4 tokens: a second short sentence

func = @reverse;
newDocuments = docfun(func,documents)

newDocuments = 
  2x1 tokenizedDocument:

    6 tokens: na elpmaxe fo a trohs ecnetnes
    4 tokens: a dnoces trohs ecnetnes

Задайте функцию документа с несколькими входными параметрами

Скрипт Open Live Script

Пометьте слова путем объединения слов от одного массива документа с другим, использования строковой функции plus.

Создайте первый tokenizedDocument массив. Сотрите пунктуацию и преобразуйте текст в нижний регистр.

str = [ ...
    "An example of a short sentence."
    "A second short sentence."];
str = erasePunctuation(str);
str = lower(str);
documents1 = tokenizedDocument(str)

documents1 = 
  2x1 tokenizedDocument:

    6 tokens: an example of a short sentence
    4 tokens: a second short sentence

Создайте второй tokenizedDocument массив. Документы имеют то же количество слов как соответствующие документы в documents1. Слова documents2 POS теги для соответствующих слов.

documents2 = tokenizedDocument([ ...
    "_det _noun _prep _det _adj _noun"
    "_det _adj _adj _noun"])

documents2 = 
  2x1 tokenizedDocument:

    6 tokens: _det _noun _prep _det _adj _noun
    4 tokens: _det _adj _adj _noun

func = @plus;
newDocuments = docfun(func,documents1,documents2)

newDocuments = 
  2x1 tokenizedDocument:

    6 tokens: an_det example_noun of_prep a_det short_adj sentence_noun
    4 tokens: a_det second_adj short_adj sentence_noun

Выход различный как вызов plus на документах непосредственно.

plus(documents1,documents2)

ans = 
  2x1 tokenizedDocument:

    12 tokens: an example of a short sentence _det _noun _prep _det _adj _noun
     8 tokens: a second short sentence _det _adj _adj _noun

Входные параметры

свернуть все

`func` — Указатель на функцию
указатель на функцию

Указатель на функцию, который принимает строковые массивы N как вводы и выводы массив строк. func должен принять string(documents1(i)),...,string(documentsN(i)) как введено.

Указатель на функцию, чтобы примениться к словам в документах. Функция должна иметь один из следующих синтаксисов:

newWords = func(words), где words массив строк слов единого документа.
newWords = func(words,details), где words массив строк слов единого документа и details соответствующая таблица маркерной подробной информации, предоставленной tokenDetails.
newWords = func(words1,...,wordsN), где words1,...,wordsN строковые массивы слов.

Пример: @reverse

Типы данных: function_handle

`documents` — Введите документы
`tokenizedDocument` массив

Введите документы в виде tokenizedDocument массив.

Выходные аргументы

свернуть все

`newDocuments` — Выведите документы
`tokenizedDocument` массив

Выведите документы, возвращенные как tokenizedDocument массив.

Темы

Введенный в R2017b

Документация

docfun

Синтаксис

Описание

Примеры

Противоположные слова в документах

Задайте функцию документа с несколькими входными параметрами

Входные параметры

`func` — Указатель на функцию
указатель на функцию

`documents` — Введите документы
`tokenizedDocument` массив

Выходные аргументы

`newDocuments` — Выведите документы
`tokenizedDocument` массив

Смотрите также

Темы

Документация Text Analytics Toolbox

Поддержка

Документация

docfun

Синтаксис

Описание

Примеры

Противоположные слова в документах

Задайте функцию документа с несколькими входными параметрами

Входные параметры

func — Указатель на функцию указатель на функцию

documents — Введите документы tokenizedDocument массив

Выходные аргументы

newDocuments — Выведите документы tokenizedDocument массив

Смотрите также

Темы

Документация Text Analytics Toolbox

Поддержка

`func` — Указатель на функцию
указатель на функцию

`documents` — Введите документы
`tokenizedDocument` массив

`newDocuments` — Выведите документы
`tokenizedDocument` массив