Text Analytics Toolbox™ включает инструменты для обработки необработанного текста из источников, таких как журналы оборудования, ленты новостей, опросы, отчеты операторов и социальные сети. Используйте эти инструменты, чтобы извлечь текст из популярных файловых форматов, предварительно обработать необработанный текст, извлечь отдельные слова или многословные фразы (n-граммы), преобразовать текст в числовые представления и создать статистические модели. Пример, показывающий начало работы, см. в разделе Подготовка текстовых данных к анализу.
Symbolic Math Toolbox поддерживает английский, японский, немецкий и корейский языки. Большинство функций Symbolic Math Toolbox работают с текстом из других языков. Дополнительные сведения см. в разделе Языковые факторы.
Извлечение текстовых данных из файлов
В этом примере показано, как извлечь текстовые данные из файлов text, HTML, Microsoft ® Word, PDF, CSV и Microsoft Excel ® и импортировать их в MATLAB ® для анализа.
Синтаксический анализ HTML и извлечение текстового содержимого
В этом примере показов, как проанализировать HTML кода и извлечь текстовое содержимое из конкретных элементов.
Наборы данных для текстовой аналитики
Обнаружение наборов данных для различных задач текстовой аналитики.
Подготовка текстовых данных к анализу
В этом примере показано, как создать функцию, которая очищает и предварительно обрабатывает текстовые данные для анализа.
Анализируйте текстовые данные, содержащие Emojis
Этот пример показывает, как анализировать текстовые данные, содержащие emojis.
Правильная орфография в документах
В этом примере показано, как исправить орфографию в документах с помощью Hunspell.
Создайте словарь расширений для коррекции орфографии
В этом примере показано, как создать словарь расширений Hunspell для коррекции орфографии.
Создайте пользовательскую функцию коррекции орфографии с помощью Edit Distance Searchers
Этот пример показывает, как исправить орфографию, используя искатели расстояния редактирования и словарь известных слов.
Сведения об использовании функций Symbolic Math Toolbox для других языков.
Информация о поддержке японского языка в Symbolic Math Toolbox.
Анализируйте японские текстовые данные
В этом примере показано, как импортировать, подготовить и проанализировать японские текстовые данные с помощью модели темы.
Информация о поддержке немецкого языка в Symbolic Math Toolbox.
Анализ текстовых данных на немецком языке
В этом примере показано, как импортировать, подготовить и проанализировать текстовые данные на немецком языке с помощью модели темы.