wordCloudCounts

Считайте слова для создания облака слов

Синтаксис

Описание

пример

T = wordCloudCounts(str) токенизация и предварительная обработка текста в str для создания облака слов и возвращает таблицу T слов и счетчиков частоты. Функция поддерживает английский, японский, немецкий и корейский текст.

Примеры

свернуть все

Извлеките текст из sonnets.txt использование extractFileText.

str = extractFileText("sonnets.txt");

Просмотр первого сонета.

i = strfind(str,"I");
ii = strfind(str,"II");
start = i(1);
fin = ii(1);
extractBetween(str,start,fin-1)
ans = 
    "I
     
       From fairest creatures we desire increase,
       That thereby beauty's rose might never die,
       But as the riper should by time decease,
       His tender heir might bear his memory:
       But thou, contracted to thine own bright eyes,
       Feed'st thy light's flame with self-substantial fuel,
       Making a famine where abundance lies,
       Thy self thy foe, to thy sweet self too cruel:
       Thou that art now the world's fresh ornament,
       And only herald to the gaudy spring,
       Within thine own bud buriest thy content,
       And tender churl mak'st waste in niggarding:
         Pity the world, or else this glutton be,
         To eat the world's due, by the grave and thee.
     
       "

Выполните токенизацию и предварительную обработку текста сонетов и составьте таблицу отсчётов частот слов.

T = wordCloudCounts(str);
head(T)
ans=8×2 table
     Word     Count
    ______    _____

    "thy"      281 
    "thou"     235 
    "love"     188 
    "thee"     162 
    "eyes"      90 
    "doth"      88 
    "make"      63 
    "mine"      63 

Входные параметры

свернуть все

Вход текст, заданный как строковые массивы, вектор символов или массив ячеек векторов символов.

Для строкового входа, wordcloud и wordCloudCounts функции используют английский, японский, немецкий и корейский языки, остановку удаления слов и нормализацию слова.

Пример: ["an example of a short document";"a second short document"]

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Таблица отсчётов слов, отсортированных в порядке важности. Таблица имеет столбцы:

WordСтроковый скаляр слова.
CountКоличество появлений слова в документах. Функция группирует счетчики слов, которые различаются только по регистрам или имеют общий ствол в соответствии с normalizeWords. Например, функция группирует счета для «прогулки», «Ходьбы», «ходьбы» и «прогулок».

Подробнее о

свернуть все

Языковые факторы

Для строкового входа, wordcloud и wordCloudCounts функции используют английский, японский, немецкий и корейский языки, остановку удаления слов и нормализацию слова.

Введенный в R2017b