Моделирование и прогноз

Разработайте прогнозирующие модели с помощью моделей темы и вложений слова.

Найти кластеры и извлечение показывает от высоко-размерных текстовых наборов данных, можно использовать методы машинного обучения и модели, такие как LSA, LDA и вложения слова. Можно сочетать функции, созданные с Text Analytics Toolbox™ с функциями от других источников данных. С этими функциями можно создать модели машинного обучения, которые используют в своих интересах текстовые, числовые, и другие типы данных.

Функции

развернуть все

fitldaПодходящая модель скрытого выделения Дирихле (LDA)
fitlsaПодходящая модель LSA
resumeПродолжите соответствовать модели LDA
logpЛогарифмические вероятности документа и качество подгонки модели LDA
predictПредскажите главные темы LDA документов
transformПреобразуйте документы в более низкое мерное пространство
ldaModelМодель Latent Dirichlet allocation (LDA)
lsaModelМодель Latent semantic analysis (LSA)
fastTextWordEmbeddingПредварительно обученное fastText встраивание слова
wordEncodingМодель кодирования Word, чтобы сопоставить слова с индексами и назад
doc2sequenceПреобразуйте документы последовательностям для глубокого обучения
wordEmbeddingLayerСлой встраивания Word для нейронных сетей для глубокого обучения
word2vecСопоставьте слово со встраиванием вектора
word2indСопоставьте слово с кодированием индекса
vec2wordСопоставьте вектор встраивания со словом
ind2wordСопоставьте индекс кодирования со словом
isVocabularyWordПротестируйте, если слово является участником встраивания слова или кодирования
readWordEmbeddingСчитайте встраивание слова из файла
trainWordEmbeddingОбучите встраивание слова
writeWordEmbeddingЗапишите файл встраивания слова
wordEmbeddingМодель встраивания Word, чтобы сопоставить слова с векторами и назад
bagOfWordsМодель сумки слов
bagOfNgramsМешок n модели граммов
addDocumentДобавьте документы сумке слов или мешку n модели граммов
removeDocumentУдалите документы из сумки слов или мешка n модели граммов
removeInfrequentWordsУдалите слова с низкими количествами из модели сумки слов
removeInfrequentNgramsУдалите нечасто замечаемые N-граммы из мешка n модели граммов
removeWordsУдалите выбранные слова из модели сумки слов или документов
removeNgramsУдалите N-граммы из мешка n модели граммов
removeEmptyDocumentsУдалите пустые документы из маркируемого массива документа, модель сумки слов или мешок n модели граммов
topkwordsБольшинство важных слов в модели сумки слов или теме LDA
topkngramsБольшинство частых N-грамм
encodeЗакодируйте документы как матрицу количеств n-граммы или слова
tfidfНазовите Обратную Частотой Частоту Документа (tf-idf) матрицей
joinОбъедините несколько сумка слов или мешок n моделей граммов
wordcloudСоздайте график облака слова из текста, модели сумки слов, мешка n модели граммов или модели LDA
textscatter2D график рассеивания текста
textscatter33-D график рассеивания текста

Темы

Классификация текстов

Создайте простую текстовую модель для классификации

Этот пример показывает, как обучить простой текстовый классификатор на количествах частотности слова с помощью модели сумки слов.

Обучите классификатор чувства

Этот пример показывает, как обучить классификатор анализу мнений с помощью аннотируемого списка положительных и отрицательных слов чувства и предварительно обученного встраивания слова.

Классифицируйте текстовые данные Используя глубокое обучение

Этот пример показывает, как классифицировать текстовые описания прогнозов погоды с помощью сети долгой краткосрочной памяти (LSTM) глубокого обучения.

Классифицируйте текстовые данные Используя сверточную нейронную сеть

Этот пример показывает, как классифицировать текстовые данные с помощью сверточной нейронной сети.

Классифицируйте текстовые данные из памяти Используя глубокое обучение

Этот пример показывает, как классифицировать текстовые данные из памяти с нейронной сетью для глубокого обучения с помощью преобразованного datastore.

Подсчет n-граммы и моделирование темы

Анализируйте текстовые данные Используя фразы многословные

Этот пример показывает, как анализировать текст с помощью подсчета частот n-граммы.

Анализируйте текстовые данные Используя модели темы

Этот пример показывает, как использовать модель темы Скрытого выделения Дирихле (LDA), чтобы анализировать текстовые данные.

Выберите Number of Topics for LDA Model

Этот пример показывает, как выбрать подходящее количество тем для модели скрытого выделения Дирихле (LDA).

Сравните решатели LDA

Этот пример показывает, как сравнить решатели скрытого выделения Дирихле (LDA) путем сравнения качества подгонки и время, потраченное, чтобы соответствовать модели.

Текстовая генерация

Сгенерируйте текст Используя глубокое обучение (Deep Learning Toolbox)

Этот пример показывает, как обучить сеть долгой краткосрочной памяти (LSTM) глубокого обучения генерировать текст.

Гордитесь и нанесите ущерб и MATLAB

Этот пример показывает, как обучить сеть LSTM глубокого обучения, чтобы сгенерировать текст с помощью символьных вложений.

Пословно текстовая генерация Используя глубокое обучение

Этот пример показывает, как обучить сеть LSTM глубокого обучения, чтобы сгенерировать текст пословно.

Поддержка языка

Факторы языка

Информация об использовании функций Text Analytics Toolbox для других языков.

Японская поддержка языка

Информация о японской поддержке в Text Analytics Toolbox.

Анализируйте японские текстовые данные

Этот пример показывает, как импортировать, подготовить, и анализировать японские текстовые данные с помощью модели темы.

Немецкая поддержка языка

Информация о немецкой поддержке в Text Analytics Toolbox.

Анализируйте немецкие текстовые данные

Этот пример показывает, как импортировать, подготовить, и анализировать немецкие текстовые данные с помощью модели темы.

Популярные примеры