Добавление идентификаторов языков к документам
Использовать addLanguageDetails
для добавления идентификаторов языков к документам.
Функция поддерживает английский, японский, немецкий и корейский текст.
определяет язык updatedDocuments
= addLanguageDetails(documents
)documents
и обновляет детали лексемы. Функция добавляет детали к лексемам только с отсутствующими деталями языка. Чтобы получить сведения о языке от updatedDocuments
, использование tokenDetails
.
задает дополнительные опции, используя одну или несколько пары "имя-значение".updatedDocuments
= addLanguageDetails(documents
,Name,Value
)
Совет
Использовать addLanguageDetails
перед использованием lower
и upper
функционирует как addLanguageDetails
использует информацию, которая удаляется этими функциями.
abbreviations
| addEntityDetails
| addEntityDetails
| addLemmaDetails
| addPartOfSpeechDetails
| addSentenceDetails
| addTypeDetails
| corpusLanguage
| splitSentences
| tokenDetails
| tokenizedDocument
| topLevelDomains