Statistics and Machine Learning Toolbox

Анализируйте и моделируйте данные с помощью статистики и машинного обучения

Statistics and Machine Learning Toolbox™ предоставляет функции и приложения для описания, анализа и моделирования данных. Можно использовать описательную статистику, визуализацию, и кластеризирующийся для исследовательского анализа данных, строить распределения вероятности к данным, сгенерировать случайные числа для симуляций Монте-Карло и выполнить тесты гипотезы. Алгоритмы регрессии и классификации позволяют вам чертить выводы из данных и создать прогнозные модели или в интерактивном режиме, с помощью Классификации и приложений Regression Learner, или программно, с помощью AutoML.

Для анализа многомерных данных и извлечения признаков, тулбокс обеспечивает анализ главных компонентов (PCA), регуляризацию, сокращение размерности и методы выбора признаков, которые позволяют вам идентифицировать переменные с лучшей предсказательной силой.

Тулбокс обеспечивает контролируемый, полуалгоритмы машинного обучения с учителем и без учителя, включая машины опорных векторов (SVMs), повышенные деревья решений, k - средние значения и другие методы кластеризации. Можно применить interpretability методы, такие как частичные графики зависимости и LIME, и автоматически сгенерировать код C/C++ для встроенного развертывания. Много алгоритмов тулбокса могут использоваться на наборах данных, которые являются слишком большими, чтобы храниться в памяти.

Запуск

Изучите основы Statistics and Machine Learning Toolbox

Описательная статистика и визуализация

Импорт и экспорт данных, описательная статистика, визуализация

Вероятностные распределения

Модели частоты данных, генерация случайной выборки, оценка параметра

Тесты гипотезы

t-тест, F-тест, критерий согласия Хи-квадрат и другие

Кластерный анализ

Безнадзорные методы изучения, чтобы найти естественные группировки и шаблоны в данных

ДИСПЕРСИОННЫЙ АНАЛИЗ

Дисперсионный анализ и ковариационный анализ, многомерный дисперсионный анализ, дисперсионный анализ с повторными измерениями

Регрессия

Линейные, обобщенные линейные, нелинейные, и непараметрические методы для контролируемого изучения

Классификация

Контролируемый и полуалгоритмы контролируемого обучения для бинарных и многоклассовых задач

Сокращение размерности и извлечение признаков

PCA, факторный анализ, выбор признаков, извлечение признаков и другие

Промышленная статистика

Проект экспериментов (DOE); анализ выживания и надежности; статистическое управление процессами

Анализ Больших данных с длинными массивами

Анализируйте данные, которые не помещаются в память,

Ускорьте статистические расчеты

Параллельный или распределенный расчет статистических функций

Генерация кода

Сгенерируйте код C/C++ и MEX-функции для функций Statistics and Machine Learning Toolbox