T = wordCloudCounts(str) токенизация и предварительная обработка текста в str для создания облака слов и возвращает таблицу T слов и счетчиков частоты. Функция поддерживает английский, японский, немецкий и корейский текст.
Извлеките текст из sonnets.txt использование extractFileText.
str = extractFileText("sonnets.txt");
Просмотр первого сонета.
i = strfind(str,"I");
ii = strfind(str,"II");
start = i(1);
fin = ii(1);
extractBetween(str,start,fin-1)
ans =
"I
From fairest creatures we desire increase,
That thereby beauty's rose might never die,
But as the riper should by time decease,
His tender heir might bear his memory:
But thou, contracted to thine own bright eyes,
Feed'st thy light's flame with self-substantial fuel,
Making a famine where abundance lies,
Thy self thy foe, to thy sweet self too cruel:
Thou that art now the world's fresh ornament,
And only herald to the gaudy spring,
Within thine own bud buriest thy content,
And tender churl mak'st waste in niggarding:
Pity the world, or else this glutton be,
To eat the world's due, by the grave and thee.
"
Выполните токенизацию и предварительную обработку текста сонетов и составьте таблицу отсчётов частот слов.
str - Входной текст массив строк | символьный вектор | ячеек из символьных векторов
Вход текст, заданный как строковые массивы, вектор символов или массив ячеек векторов символов.
Для строкового входа, wordcloud и wordCloudCounts функции используют английский, японский, немецкий и корейский языки, остановку удаления слов и нормализацию слова.
Пример: ["an example of a short document";"a second short document"]
Таблица отсчётов слов, отсортированных в порядке важности. Таблица имеет столбцы:
Word
Строковый скаляр слова.
Count
Количество появлений слова в документах. Функция группирует счетчики слов, которые различаются только по регистрам или имеют общий ствол в соответствии с normalizeWords. Например, функция группирует счета для «прогулки», «Ходьбы», «ходьбы» и «прогулок».
Для строкового входа, wordcloud и wordCloudCounts функции используют английский, японский, немецкий и корейский языки, остановку удаления слов и нормализацию слова.
Для просмотра документации необходимо авторизоваться на сайте
Памятка переводчика
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.