Добавьте, что тип маркера назначает в документы
updatedDocuments = addTypeDetails(documents)
updatedDocuments = addTypeDetails(documents,'TopLevelDomains',domains)
обнаруживает типы маркера в updatedDocuments
= addTypeDetails(documents
)documents
и обновляет маркерные детали. Функция добавляет, что тип назначает в лексемы с неизвестным типом только. Чтобы получить типы маркера от updatedDocuments
, используйте tokenDetails
.
также задает области верхнего уровня, чтобы использовать для обнаружения веб-адреса.updatedDocuments
= addTypeDetails(documents
,'TopLevelDomains',domains
)
Используйте addTypeDetails
перед использованием lower
, upper
, и функции erasePunctuation
как addTypeDetails
используют информацию, которая удалена этими функциями.
abbreviations
| addEntityDetails
| addLanguageDetails
| addLemmaDetails
| addPartOfSpeechDetails
| addSentenceDetails
| corpusLanguage
| splitSentences
| tokenDetails
| tokenizedDocument
| topLevelDomains