Text Analytics Toolbox™ включает инструменты для обработки необработанного текста из источников, таких как журналы оборудования, ленты новостей, обзоры, отчеты оператора и социальные сети. Используйте эти инструменты, чтобы извлечь текст из популярных файловых форматов, предварительно обработать необработанный текст, извлечь отдельные слова или фразы многословные (N-граммы), преобразовать текст в числовые представления и статистические модели сборки. Для примера, показывающего, как начать, смотрите, Готовят текстовые Данные к Анализу.
Text Analytics Toolbox поддерживает Английский, Японский ,Немецкий и Корейский языки. Большинство функций Text Analytics Toolbox работает с текстом с других языков. Для получения дополнительной информации смотрите Факторы Языка.
Извлеките текстовые данные из файлов
В этом примере показано, как извлечь текстовые данные из текста, HTML, Microsoft® Word, PDF, CSV и файлы Microsoft Excel® и импортировать его в MATLAB® для анализа.
Проанализируйте HTML и извлеките текстовое содержимое
В этом примере показано, как проанализировать код HTML и извлечь текстовое содержимое из конкретных элементов.
Подготовьте текстовые данные к анализу
В этом примере показано, как создать функцию, которая чистит и предварительно обрабатывает текстовые данные для анализа.
Анализируйте текстовые данные, содержащие эмодзи
В этом примере показано, как анализировать текстовые данные, содержащие эмодзи.
Правильное написание Используя искателей расстояния редактирования
В этом примере показано, как откорректировать написание с помощью искателей расстояния редактирования и словаря известных слов.
Информация об использовании функций Text Analytics Toolbox для других языков.
Информация о японской поддержке в Text Analytics Toolbox.
Анализируйте японские текстовые данные
В этом примере показано, как импортировать, подготовьтесь и анализируйте японские текстовые данные с помощью модели темы.
Информация о немецкой поддержке в Text Analytics Toolbox.
Анализируйте немецкие текстовые данные
В этом примере показано, как импортировать, подготовьтесь и анализируйте немецкие текстовые данные с помощью модели темы.