Извлеките ключевые слова с помощью RAKE
ключевые слова извлечений и соответствующие баллы с помощью алгоритма Быстрой автоматической экстракции ключевого слова (RAKE). Функция поддерживает английский, японский язык, немецкий язык и корейский текст. Изучить, как использовать tbl = rakeKeywords(documents)rakeKeywords для других языков смотрите Факторы Языка.
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".tbl = rakeKeywords(documents,Name,Value)
Совет
rakeKeywords функция, по умолчанию, извлекает ключевые слова с помощью слов остановки и символов пунктуации. При использовании значений по умолчанию для 'Delimiters' и 'MergingDelimiters' опции, не удаляйте слова остановки или символы пунктуации из входного текста.
Можно экспериментировать с различными алгоритмами экстракции ключевого слова, чтобы видеть то, что работает лучше всего с данными. Поскольку алгоритм ключевых слов RAKE использует основанный на разделителе подход, чтобы извлечь ключевые слова кандидата, извлеченные ключевые слова могут быть очень длинными. В качестве альтернативы можно попытаться извлечь использование ключевых слов алгоритм TextRank, который запускается с отдельных лексем как ключевые слова кандидата и затем объединяет их в надлежащих случаях. Чтобы извлечь использование ключевых слов TextRank, используйте textrankKeywords функция. Чтобы узнать больше, смотрите Ключевые слова Извлечения из текстовых Данных Используя TextRank.
[1] Повысился, Стюарт, Дэйв Энгель, Ник Крамер и Венди Коули. "Автоматическая экстракция ключевого слова из отдельных документов". Анализ текста: приложения и теория 1 (2010): 1-20.