Подбирайте модель LSA
Модель скрытого семантического анализа (LSA) обнаруживает отношения между документами и словами, которые они содержат. Модель LSA является инструментом сокращения размерности, полезным для выполнения низко-размерных статистических моделей на высоко-размерных подсчетах слов. Если модель была подходящим использованием мешка n модели граммов, то программное обеспечение обрабатывает N-граммы как отдельные слова.
подбирает модель LSA с mdl = fitlsa(bag,numComponents)numComponents компоненты к сумке слов или мешку n модели bag граммов.
подбирает модель LSA к документам, представленным матрицей подсчетов слов mdl = fitlsa(counts,numComponents)counts.
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".mdl = fitlsa(___,Name,Value)
bagOfNgrams | bagOfWords | fitlda | ldaModel | lsaModel | transform