exponenta event banner

Инструментарий для статистики и машинного обучения

Анализ и моделирование данных с использованием статистики и машинного обучения

Toolbox™ статистики и машинного обучения предоставляет функции и приложения для описания, анализа и моделирования данных. Можно использовать описательную статистику, визуализации и кластеризацию для анализа исследовательских данных, подгонять распределения вероятностей к данным, создавать случайные числа для моделирования Монте-Карло и выполнять тесты гипотез. Алгоритмы регрессии и классификации позволяют извлекать выводы из данных и строить прогностические модели либо в интерактивном режиме с помощью приложений Classification and Regression Learner, либо программно с помощью AutoML.

Для многомерного анализа данных и извлечения элементов инструментарий предоставляет методы анализа основных компонентов (PCA), регуляризации, уменьшения размерности и выбора элементов, которые позволяют идентифицировать переменные с наилучшей прогностической силой.

Инструментарий предоставляет контролируемые, полууправляемые и неподконтрольные алгоритмы машинного обучения, включая вспомогательные векторные машины (SVM), усиленные деревья решений, k-средства и другие методы кластеризации. Можно применять методы интерпретации, такие как графики частичной зависимости и LIME, и автоматически создавать код C/C + + для встроенного развертывания. Многие алгоритмы панели инструментов могут использоваться в наборах данных, которые слишком велики для хранения в памяти.

Начало работы

Изучение основ статистики и инструментария машинного обучения

Описательная статистика и визуализация

Импорт и экспорт данных, описательная статистика, визуализация

Распределения вероятностей

Частотные модели данных, формирование случайных выборок, оценка параметров

Тесты гипотез

t-тест, F-тест, тест пригодности хи-квадрат и многое другое

Кластерный анализ

Неконтролируемые методы обучения для поиска естественных группировок и закономерностей в данных

АНОВА

Анализ дисперсии и ковариации, многовариантная ANOVA, повторные меры ANOVA

Регресс

Линейные, обобщенные линейные, нелинейные и непараметрические методы для контролируемого обучения

Классификация

Контролируемые и полууправляемые алгоритмы обучения для двоичных и многоклассовых проблем

Уменьшение размерности и извлечение элементов

PCA, факторный анализ, выбор элементов, извлечение элементов и многое другое

Промышленная статистика

Разработка экспериментов (DOE); анализ выживаемости и надежности; статистический контроль процессов

Анализ больших данных с помощью массивов Tall

Анализ данных, не связанных с памятью

Ускорение статистических вычислений

Параллельное или распределенное вычисление статистических функций

Создание кода

Создание кода C/C + + и функций MEX для функций статистики и инструментария машинного обучения