Добавление сведений о типах лексем в документы
обнаруживает типы лексем в updatedDocuments
= addTypeDetails(documents
)documents
и обновляет детали лексемы. Функция добавляет подробные данные типа только к лексемам с неизвестным типом. Чтобы получить типы лексем от updatedDocuments
, использование tokenDetails
.
задает дополнительные опции, используя одну или несколько пары "имя-значение".updatedDocuments
= addTypeDetails(documents
,Name,Value
)
Совет
Использовать addTypeDetails
перед использованием lower
, upper
, и erasePunctuation
функционирует как addTypeDetails
использует информацию, которая удаляется этими функциями.
abbreviations
| addEntityDetails
| addLanguageDetails
| addLemmaDetails
| addPartOfSpeechDetails
| addSentenceDetails
| corpusLanguage
| splitSentences
| tokenDetails
| tokenizedDocument
| topLevelDomains