textanalytics.ja.mecabToNER

Извлечение информации о именованной сущности из выхода MeCab для японского языка

Описание

entities = textanalytics.ja.mecabToNER(words,info) извлекает данные именованного объекта из выхода MeCab в формате, возвращенном MeCab-ипадическим словарем.

Входные параметры

свернуть все

Входные лексемы, заданные как строковый вектор.

Типы данных: string

Информационный struct со следующими полями:

  • Feature - Строка вектор лексем того же размера, что и words содержащие выходные линии MeCab в формате ChaSen без самих разделённых лексем.

  • PartOfSpeech - Численный код, используемый в MeCab-ipadic словаре для классификации части речи.

Типы данных: struct

Выходные аргументы

свернуть все

Извлеченная информация о сущности, возвращенная в виде категориального вектора того же размера, что и words.

Введенный в R2019b