Применить функцию к словам в документах
вызывает функцию, заданную указателем на функцию newDocuments
= docfun(func
,documents
)func
и передает элементы documents
как строковый вектор слов.
Если func
принимает ровно один входной параметр, затем слова newDocuments(i)
являются выходы func(string(documents(i)))
.
Если func
принимает два входных параметров, затем слова newDocuments(i)
являются выходы func(string(documents(i)),details)
, где details
содержит соответствующие сведения о лексеме, выводимые tokenDetails
.
Если func
изменяет количество слов в документе, затем docfun
удаляет из этого документа сведения о лексеме.
docfun
не выполняет вызовы для работы func
в определенном порядке.
вызывает функцию, заданную указателем на функцию newDocuments
= docfun(func
,documents1,...,documentsN)func
и передает элементы documents1,…,documentsN
как строковые векторы слов, где N - количество входов в функцию func
. Слова newDocuments(i)
являются выходы func(string(documents1(i)),...,string(documentsN(i)))
.
Каждый из documents1,…,documentsN
должен быть одинаковым размером.
addPartOfSpeechDetails
| addSentenceDetails
| bagOfNgrams
| bagOfWords
| decodeHTMLEntities
| lower
| plus
| regexprep
| replace
| tokenDetails
| tokenizedDocument
| upper