Подбирайте модель LSA
Модель скрытого семантического анализа (LSA) обнаруживает отношения между документами и словами, которые они содержат. Модель LSA является инструментом сокращения размерности, полезным для выполнения низко-размерных статистических моделей на высоко-размерных подсчетах слов. Если модель была подходящим использованием мешка n модели граммов, то программное обеспечение обрабатывает N-граммы как отдельные слова.
подбирает модель LSA с mdl
= fitlsa(bag
,numComponents
)numComponents
компоненты к сумке слов или мешку n модели bag
граммов.
подбирает модель LSA к документам, представленным матрицей подсчетов слов mdl
= fitlsa(counts
,numComponents
)counts
.
задает дополнительные опции с помощью одного или нескольких аргументов пары "имя-значение".mdl
= fitlsa(___,Name,Value
)
bagOfNgrams
| bagOfWords
| fitlda
| ldaModel
| lsaModel
| transform