Toolbox™ статистики и машинного обучения предоставляет функции и приложения для описания, анализа и моделирования данных. Можно использовать описательную статистику, визуализации и кластеризацию для анализа исследовательских данных, подгонять распределения вероятностей к данным, создавать случайные числа для моделирования Монте-Карло и выполнять тесты гипотез. Алгоритмы регрессии и классификации позволяют извлекать выводы из данных и строить прогностические модели либо в интерактивном режиме с помощью приложений Classification and Regression Learner, либо программно с помощью AutoML.
Для многомерного анализа данных и извлечения элементов инструментарий предоставляет методы анализа основных компонентов (PCA), регуляризации, уменьшения размерности и выбора элементов, которые позволяют идентифицировать переменные с наилучшей прогностической силой.
Инструментарий предоставляет контролируемые, полууправляемые и неподконтрольные алгоритмы машинного обучения, включая вспомогательные векторные машины (SVM), усиленные деревья решений, k-средства и другие методы кластеризации. Можно применять методы интерпретации, такие как графики частичной зависимости и LIME, и автоматически создавать код C/C + + для встроенного развертывания. Многие алгоритмы панели инструментов могут использоваться в наборах данных, которые слишком велики для хранения в памяти.
Изучение основ статистики и инструментария машинного обучения
Импорт и экспорт данных, описательная статистика, визуализация
Частотные модели данных, формирование случайных выборок, оценка параметров
t-тест, F-тест, тест пригодности хи-квадрат и многое другое
Неконтролируемые методы обучения для поиска естественных группировок и закономерностей в данных
Анализ дисперсии и ковариации, многовариантная ANOVA, повторные меры ANOVA
Линейные, обобщенные линейные, нелинейные и непараметрические методы для контролируемого обучения
Контролируемые и полууправляемые алгоритмы обучения для двоичных и многоклассовых проблем
PCA, факторный анализ, выбор элементов, извлечение элементов и многое другое
Разработка экспериментов (DOE); анализ выживаемости и надежности; статистический контроль процессов
Анализ данных, не связанных с памятью
Параллельное или распределенное вычисление статистических функций
Создание кода C/C + + и функций MEX для функций статистики и инструментария машинного обучения