Добавьте, что тип маркера назначает в документы
updatedDocuments = addTypeDetails(documents)updatedDocuments = addTypeDetails(documents,'TopLevelDomains',domains) обнаруживает типы маркера в updatedDocuments = addTypeDetails(documents)documents и обновляет маркерные детали. Функция добавляет, что тип назначает в лексемы с неизвестным типом только. Чтобы получить типы маркера от updatedDocuments, используйте tokenDetails.
также задает области верхнего уровня, чтобы использовать для обнаружения веб-адреса.updatedDocuments = addTypeDetails(documents,'TopLevelDomains',domains)
Используйте addTypeDetails перед использованием lower, upper, и функции erasePunctuation как addTypeDetails используют информацию, которая удалена этими функциями.
abbreviations | addEntityDetails | addLanguageDetails | addLemmaDetails | addPartOfSpeechDetails | addSentenceDetails | corpusLanguage | splitSentences | tokenDetails | tokenizedDocument | topLevelDomains