exponenta event banner

doc2cell

Преобразование документов в массив ячеек векторов строк

Описание

пример

C = doc2cell(documents) преобразует tokenizedDocument массив к массиву ячеек. Записи C - это массивы строк, содержащие соответствующие слова в каждом документе.

Примеры

свернуть все

Преобразовать a tokenizedDocument массив к массиву ячеек строковых векторов.

documents = tokenizedDocument([ ...
    "an example of a short sentence" ...
    "a second short sentence"])
documents = 
  1x2 tokenizedDocument:

    6 tokens: an example of a short sentence
    4 tokens: a second short sentence

C = doc2cell(documents)
C=1×2 cell array
    {1x6 string}    {1x4 string}

Просмотр первого элемента массива ячеек.

C{1}
ans = 1x6 string
    "an"    "example"    "of"    "a"    "short"    "sentence"

Входные аргументы

свернуть все

Исходные документы, указанные как tokenizedDocument массив.

Выходные аргументы

свернуть все

Массив выходных ячеек векторов строк. Каждый элемент C - строковый вектор, содержащий слова соответствующего документа.

Представлен в R2017b