Извлечь ключевые слова с помощью RAKE
извлекает ключевые слова и соответствующие оценки с помощью алгоритма Rapid Automatic Keyword Extraction (RAKE). Функция поддерживает английский, японский, немецкий и корейский тексты. Как использовать tbl = rakeKeywords(documents)rakeKeywords для других языков см. Языковые рекомендации.
указывает дополнительные параметры, использующие один или несколько аргументов пары имя-значение.tbl = rakeKeywords(documents,Name,Value)
Совет
rakeKeywords функция по умолчанию извлекает ключевые слова, используя стоп-слова и знаки препинания. При использовании значений по умолчанию для 'Delimiters' и 'MergingDelimiters' не удаляйте стоп-слова или знаки препинания из входного текста.
Можно экспериментировать с различными алгоритмами извлечения ключевых слов, чтобы увидеть, что лучше всего работает с данными. Поскольку алгоритм ключевых слов RAKE использует основанный на разделителях подход для извлечения ключевых слов-кандидатов, извлеченные ключевые слова могут быть очень длинными. Кроме того, можно попытаться извлечь ключевые слова с помощью алгоритма TextRank, который начинается с отдельных маркеров в качестве ключевых слов-кандидатов, а затем объединяет их при необходимости. Для извлечения ключевых слов с помощью TextRank используйте textrankKeywords функция. Дополнительные сведения см. в разделе Извлечение ключевых слов из текстовых данных с помощью TextRank.
[1] Роуз, Стюарт, Дэйв Энгел, Ник Крамер и Венди Коули. «Автоматическое извлечение ключевых слов из отдельных документов». Анализ текста: приложения и теория 1 (2010): 1-20.