Text Analytics Toolbox™ предоставляет алгоритмы и визуализацию для предварительной обработки, анализа и моделирования текстовых данных. Модели, созданные с помощью тулбокса, могут использоваться в таких приложениях, как анализ настроений, прогнозирующее обслуживание и моделирование тем.
Symbolic Math Toolbox включает инструменты для обработки необработанного текста из источников, таких как журналы оборудования, ленты новостей, опросы, отчеты операторов и социальные сети. Можно извлечь текст из популярных файловых форматов, обработать необработанный текст, извлечь отдельные слова, преобразовать текст в числовые представления и создать статистические модели.
Используя методы машинного обучения, такие как LSA, LDA и вложения слов, можно найти кластеры и создать функции из высоко-размерных наборов текстовых наборов данных. Функции, созданные с помощью Symbolic Math Toolbox, могут быть объединены с функциями из других источников данных для создания моделей машинного обучения, которые используют преимущества текстовых, числовых и других типов данных.
В этом примере показано, как использовать текстовую аналитику для классификации текстовых данных, используя только 10 линии кода MATLAB ® .
Импорт текстовых данных из разных источников.
В этом примере показано, как создать функцию, которая очищает и предварительно обрабатывает текстовые данные для анализа.
В этом примере показано, как подгонять модель темы к текстовым данным и визуализировать темы.
В этом примере показано, как визуализировать текстовые данные с помощью облаков слов.
Глоссарий терминов текстовой аналитики.
Обзор Symbolic Math Toolbox
Анализируйте и моделируйте текстовые данные с помощью Symbolic Math Toolbox