Найти кластеры и извлечение показывает от высоко-размерных текстовых наборов данных, можно использовать методы машинного обучения и модели, такие как LSA, LDA и вложения слова. Можно сочетать функции, созданные с Text Analytics Toolbox™ с функциями от других источников данных. С этими функциями можно создать модели машинного обучения, которые используют в своих интересах текстовые, числовые, и другие типы данных.
Создайте простую функцию предварительной обработки
В этом примере показано, как создать функцию, которая чистит и предварительно обрабатывает текстовые данные для анализа.
Создайте простую текстовую модель для классификации
В этом примере показано, как обучить простой текстовый классификатор на количествах частотности слова с помощью модели сумки слов.
Анализируйте текстовые данные Используя фразы многословные
В этом примере показано, как анализировать текст с помощью подсчета частот n-граммы.
Анализируйте текстовые данные Используя модели темы
В этом примере показано, как использовать модель темы Скрытого выделения Дирихле (LDA), чтобы анализировать текстовые данные.
Выберите Number of Topics for LDA Model
В этом примере показано, как выбрать подходящее количество тем для модели скрытого выделения Дирихле (LDA).
В этом примере показано, как сравнить решатели скрытого выделения Дирихле (LDA) путем сравнения качества подгонки и время, потраченное, чтобы подбирать модель.
Визуализируйте кластеры документа Используя модель LDA
В этом примере показано, как визуализировать кластеризацию документов с помощью модели темы Скрытого выделения Дирихле (LDA) и графика t-SNE.
Визуализируйте корреляции темы LDA
В этом примере показано, как анализировать корреляции между темами в модели темы Скрытого выделения Дирихле (LDA).
Визуализируйте корреляции между темами LDA и метками документа
В этом примере показано, как подбирать модель темы Скрытого выделения Дирихле (LDA) и визуализировать корреляции между темами LDA и метками документа.
Создайте сеть совместной встречаемости
В этом примере показано, как создать сеть совместной встречаемости использование модели сумки слов.
В этом примере показано, как использовать Валентность Осведомленный Словарь и чувство Reasoner (VADER) алгоритм для анализа мнений.
Сгенерируйте зависящий от домена словарь чувства
В этом примере показано, как сгенерировать словарь для анализа мнений с помощью 10-K и 10-Q финансовых отчетов.
В этом примере показано, как обучить классификатор анализу мнений с помощью аннотируемого списка положительных и отрицательных слов чувства и предварительно обученного встраивания слова.
Извлеките ключевые слова из текстовых данных Используя RAKE
В этом примере показано, как извлечь ключевые слова из текстовых данных с помощью Быстрой автоматической экстракции ключевого слова (RAKE).
Извлеките ключевые слова из текстовых данных Используя TextRank
Этот пример показывает, чтобы извлечь ключевые слова из текстового использования данных TextRank.
Классифицируйте текстовые данные Используя глубокое обучение
В этом примере показано, как классифицировать текстовые данные с помощью сети долгой краткосрочной памяти (LSTM) глубокого обучения.
Классифицируйте текстовые данные Используя сверточную нейронную сеть
В этом примере показано, как классифицировать текстовые данные с помощью сверточной нейронной сети.
Классифицируйте текстовые данные из памяти Используя глубокое обучение
В этом примере показано, как классифицировать текстовые данные из памяти с нейронной сетью для глубокого обучения с помощью преобразованного datastore.
Перевод от последовательности к последовательности Используя внимание
В этом примере показано, как преобразовать десятичные строки в Римские цифры с помощью модели декодера энкодера повторяющейся последовательности к последовательности с вниманием.
Классификация мультитекстов метки Используя глубокое обучение
В этом примере показано, как классифицировать текстовые данные, которые имеют несколько независимых меток.
Сгенерируйте текст Используя глубокое обучение (Deep Learning Toolbox)
В этом примере показано, как обучить сеть долгой краткосрочной памяти (LSTM) глубокого обучения генерировать текст.
Гордитесь и нанесите ущерб и MATLAB
В этом примере показано, как обучить сеть LSTM глубокого обучения, чтобы сгенерировать текст с помощью символьных вложений.
Пословно текстовая генерация Используя глубокое обучение
В этом примере показано, как обучить сеть LSTM глубокого обучения, чтобы сгенерировать текст пословно.
Классифицируйте текстовые данные Используя пользовательский учебный цикл
В этом примере показано, как классифицировать текстовые данные с помощью глубокого обучения двунаправленная длинная краткосрочная сеть (BiLSTM) памяти с пользовательским учебным циклом.
Сгенерируйте текст Используя автоэнкодеры
В этом примере показано, как сгенерировать текстовые данные с помощью автоэнкодеров.
Задайте текстовую функцию модели энкодера
В этом примере показано, как задать текстовую функцию модели энкодера.
Задайте текстовую функцию модели декодера
В этом примере показано, как задать текстовую функцию модели декодера.
Перевод языка Используя глубокое обучение
В этом примере показано, как обучить немца к английскому переводчику языка с помощью модели декодера энкодера повторяющейся последовательности к последовательности с вниманием.
Информация об использовании функций Text Analytics Toolbox для других языков.
Информация о японской поддержке в Text Analytics Toolbox.
Анализируйте японские текстовые данные
В этом примере показано, как импортировать, подготовьтесь и анализируйте японские текстовые данные с помощью модели темы.
Информация о немецкой поддержке в Text Analytics Toolbox.
Анализируйте немецкие текстовые данные
В этом примере показано, как импортировать, подготовьтесь и анализируйте немецкие текстовые данные с помощью модели темы.