exponenta event banner

textanalytics.ja.mecabToLemma

Извлечь лемматы из выходных данных MeCab для японского языка

Описание

lemmata = textanalytics.ja.mecabToLemma(words,info) извлекает lemmata (нормализованные слова) с учетом вывода MeCab в формате, возвращаемом MeCab-ipadic словарем.

Входные аргументы

свернуть все

Входные маркеры, указанные как строковый вектор.

Типы данных: string

Информационная структура со следующими полями:

  • Feature - Строковый вектор токенов того же размера, что и words содержит выходные строки MeCab в формате ChaSen без самих разделенных маркеров.

  • PartOfSpeech - Числовой код, используемый внутри MeCab-ипадического словаря для классификации части речи.

Типы данных: struct

Выходные аргументы

свернуть все

Извлеченные лемматы, возвращенные как строковый вектор того же размера, что и words.

Представлен в R2019b