В этом примере показано, как визуализировать слова в темах модели Latent Dirichlet Allocation (LDA).
Модель скрытого выделения Дирихле (LDA) является моделью темы, которая обнаруживает базовые темы в наборе документов и выводит вероятности слова в темах. Можно визуализировать темы LDA с помощью облаков слова путем отображения слов с их соответствующими вероятностями слова темы.
Загрузите модель LDA factoryReportsLDAModel который обучен с помощью набора данных отчетов фабрики, детализирующих различные события отказа. Для примера, показывающего, как подбирать модель LDA к набору текстовых данных, смотрите, Анализируют текстовые Данные Используя Модели Темы.
load factoryReportsLDAModel
mdlmdl =
ldaModel with properties:
NumTopics: 7
WordConcentration: 1
TopicConcentration: 0.5755
CorpusTopicProbabilities: [0.1587 0.1573 0.1551 0.1534 0.1340 ... ]
DocumentTopicProbabilities: [480x7 double]
TopicWordProbabilities: [158x7 double]
Vocabulary: ["item" "occasionally" "get" ... ]
TopicOrder: 'initial-fit-probability'
FitInfo: [1x1 struct]
Визуализируйте темы с помощью wordcloud функция.
numTopics = mdl.NumTopics; figure t = tiledlayout("flow"); title(t,"LDA Topics") for i = 1:numTopics nexttile wordcloud(mdl,i); title("Topic " + i) end

tokenizedDocument | fitlda | ldaModel | wordcloud