wordCloudCounts

Считайте слова для создания облака слова

Синтаксис

Описание

пример

T = wordCloudCounts(str) маркирует и предварительно обрабатывает текст в str для создания облака слова и возвращает таблицу T из слов и подсчета частот. Функция поддерживает английский, японский язык, немецкий язык и корейский текст.

Примеры

свернуть все

Извлеките текст из sonnets.txt использование extractFileText.

str = extractFileText("sonnets.txt");

Просмотрите первый сонет.

i = strfind(str,"I");
ii = strfind(str,"II");
start = i(1);
fin = ii(1);
extractBetween(str,start,fin-1)
ans = 
    "I
     
       From fairest creatures we desire increase,
       That thereby beauty's rose might never die,
       But as the riper should by time decease,
       His tender heir might bear his memory:
       But thou, contracted to thine own bright eyes,
       Feed'st thy light's flame with self-substantial fuel,
       Making a famine where abundance lies,
       Thy self thy foe, to thy sweet self too cruel:
       Thou that art now the world's fresh ornament,
       And only herald to the gaudy spring,
       Within thine own bud buriest thy content,
       And tender churl mak'st waste in niggarding:
         Pity the world, or else this glutton be,
         To eat the world's due, by the grave and thee.
     
       "

Маркируйте и предварительно обработайте текст сонетов и составьте таблицу количеств частотности слова.

T = wordCloudCounts(str);
head(T)
ans=8×2 table
     Word     Count
    ______    _____

    "thy"      281 
    "thou"     235 
    "love"     188 
    "thee"     162 
    "eyes"      90 
    "doth"      88 
    "make"      63 
    "mine"      63 

Входные параметры

свернуть все

Введите текст, заданный как массив строк, вектор символов или массив ячеек из символьных векторов.

Для входа строки, wordcloud и wordCloudCounts функции используют английский, японский язык, немецкий язык, и корейскую токенизацию, останавливают удаление слова и нормализацию слова.

Пример: ["an example of a short document";"a second short document"]

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Таблица количеств слов отсортирована в порядке важности. Таблица имеет столбцы:

WordПредставьте скаляр в виде строки слова.
CountЧисло раз слово появляется в документах. Функциональные группы количества слов, которые отличаются только случаем или имеют общую основу согласно normalizeWords. Например, функциональные группы счета для "обхода", "Обхода", "обхода" и "обходов".

Больше о

свернуть все

Факторы языка

Для входа строки, wordcloud и wordCloudCounts функции используют английский, японский язык, немецкий язык, и корейскую токенизацию, останавливают удаление слова и нормализацию слова.

Введенный в R2017b