Statistics and Machine Learning Toolbox

Анализируйте и моделируйте данные с помощью статистики и машинного обучения

Statistics and Machine Learning Toolbox™ предоставляет функции и приложения для описания, анализа и данных моделей. Можно использовать описательную статистику, визуализацию и кластеризацию для исследовательского анализа данных, подгонять распределения вероятностей к данным, генерировать случайные числа для симуляций Монте-Карло и выполнять проверку гипотез. Алгоритмы регрессии и классификации позволяют делать выводы из данных и создавать прогнозирующие модели или в интерактивном режиме, используя приложения Classification и Regression Learner, или программно, используя AutoML.

Для многомерного анализа данных и редукции данных, тулбокс обеспечивает основной анализ компонентов (PCA), регуляризацию, уменьшение размерности и методы выбора признаков, которые позволяют идентифицировать переменные с лучшей прогностической степенью.

Тулбокс предоставляет контролируемые, полуалгоритмы машинного обучения с учителем и без учителя, включая машины опорных векторов (SVM), усиленные деревья решений, k-методы и другие методы кластеризации. Можно применить методы интерпретации, такие как графики частичной зависимости и LIME, и автоматически сгенерировать код C/C + + для встроенного развертывания. Многие алгоритмы тулбокса могут использоваться на наборах данных, которые являются слишком большими, чтобы храниться в памяти.

Запуск

Изучение основ Statistics and Machine Learning Toolbox

Описательная статистика и визуализация

Импорт и экспорт данных, описательная статистика, визуализация

Распределения вероятностей

Частотные модели данных, генерация случайной выборки, оценка параметра

Проверку гипотез

t-тест, F-тест, критерий согласия Хи-квадрат и многое другое

Кластерный анализ

Неконтролируемые методы обучения для поиска естественных группировок и шаблонов в данных

ДИСПЕРСИОННЫЙ АНАЛИЗ

Дисперсионный анализ и ковариационный анализ, многомерный дисперсионный анализ, дисперсионный анализ с повторными измерениями

Регресс

Линейные, обобщенные линейные, нелинейные и непараметрические методы для управляемого обучения

Классификация

Управляемые и полуалгоритмы контролируемого обучения для двоичных и многоклассовых задач

Уменьшение размерности и редукция данных

PCA, факторный анализ, выбор признаков, редукция данных и многое другое

Промышленная статистика

Проект экспериментов (DOE); анализ выживания и надежности; статистическое управление процессами

Анализ Больших данных с длинными массивами

Анализируйте данную , которую не помещаютсю в память,

Ускорение статистических расчетов

Параллельные или распределённые расчеты статистических функций

Генерация кода

Сгенерируйте код C/C + + и MEX-функции для функций Statistics and Machine Learning Toolbox