doclength

Длина документов в массиве документа

Синтаксис

Описание

пример

N = doclength(documents) возвращает количество лексем в каждом документе в documents.

Примеры

свернуть все

Найдите количество слов в массиве маркируемых документов. Сотрите символы пунктуации, таким образом, они не становятся считаемыми как слова.

str = [ ...
    "An example of a short sentence." 
    "A second short sentence."];
documents = tokenizedDocument(str)
documents = 
  2x1 tokenizedDocument:

    7 tokens: An example of a short sentence .
    5 tokens: A second short sentence .

documents = erasePunctuation(documents)
documents = 
  2x1 tokenizedDocument:

    6 tokens: An example of a short sentence
    4 tokens: A second short sentence

N = doclength(documents)
N = 2×1

     6
     4

Входные параметры

свернуть все

Введите документы в виде tokenizedDocument массив.

Выходные аргументы

свернуть все

Длины документа, возвращенные как вектор неотрицательных целых чисел. Размер N совпадает с размером documents.

Введенный в R2017b