doclength

Длина документов в массиве документов

Синтаксис

Описание

пример

N = doclength(documents) возвращает количество лексем в каждом документе в documents.

Примеры

свернуть все

Найдите количество слов в массиве токенизированных документов. Удалите символы пунктуации, чтобы они не считались словами.

str = [ ...
    "An example of a short sentence." 
    "A second short sentence."];
documents = tokenizedDocument(str)
documents = 
  2x1 tokenizedDocument:

    7 tokens: An example of a short sentence .
    5 tokens: A second short sentence .

documents = erasePunctuation(documents)
documents = 
  2x1 tokenizedDocument:

    6 tokens: An example of a short sentence
    4 tokens: A second short sentence

N = doclength(documents)
N = 2×1

     6
     4

Входные параметры

свернуть все

Входные документы, заданные как tokenizedDocument массив.

Выходные аргументы

свернуть все

Длины документа, возвращенные как вектор неотрицательных целых чисел. Размер N совпадает с размером documents.

Введенный в R2017b