bagOfWords
и bagOfNgrams
функционируют вход tokenizedDocument
поддержки независимо от языка. Если у вас есть массив tokenizedDocument
, содержащий ваши данные, то можно использовать эти функции.
fitlda
и fitlsa
функционируют вход bagOfWords
и bagOfNgrams
поддержки независимо от языка. Если у вас есть объект bagOfWords
или bagOfNgrams
, содержащий ваши данные, то можно использовать эти функции.
Функция trainWordEmbedding
поддерживает tokenizedDocument
или вход файла независимо от языка. Если у вас есть массив tokenizedDocument
или файл, содержащий ваши данные в правильном формате, то можно использовать эту функцию.
addLanguageDetails
| addSentenceDetails
| bagOfNgrams
| bagOfWords
| fitlda
| fitlsa
| normalizeWords
| removeWords
| stopWords
| tokenizedDocument
| wordcloud