Извлеките ключевые слова с помощью RAKE
ключевые слова извлечений и соответствующие баллы с помощью алгоритма Быстрой автоматической экстракции ключевого слова (RAKE). Функция поддерживает английский, японский язык, немецкий язык и корейский текст. Изучить, как использовать tbl
= rakeKeywords(documents
)rakeKeywords
для других языков смотрите Факторы Языка.
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".tbl
= rakeKeywords(documents
,Name,Value
)
Совет
rakeKeywords
функция, по умолчанию, извлекает ключевые слова с помощью слов остановки и символов пунктуации. При использовании значений по умолчанию для 'Delimiters'
и 'MergingDelimiters'
опции, не удаляйте слова остановки или символы пунктуации из входного текста.
Можно экспериментировать с различными алгоритмами экстракции ключевого слова, чтобы видеть то, что работает лучше всего с данными. Поскольку алгоритм ключевых слов RAKE использует основанный на разделителе подход, чтобы извлечь ключевые слова кандидата, извлеченные ключевые слова могут быть очень длинными. В качестве альтернативы можно попытаться извлечь использование ключевых слов алгоритм TextRank, который запускается с отдельных лексем как ключевые слова кандидата и затем объединяет их в надлежащих случаях. Чтобы извлечь использование ключевых слов TextRank, используйте textrankKeywords
функция. Чтобы узнать больше, смотрите Ключевые слова Извлечения из текстовых Данных Используя TextRank.
[1] Повысился, Стюарт, Дэйв Энгель, Ник Крамер и Венди Коули. "Автоматическая экстракция ключевого слова из отдельных документов". Анализ текста: приложения и теория 1 (2010): 1-20.