Statistics and Machine Learning Toolbox

Анализируйте и данные модели с помощью статистики и машинного обучения

Statistics and Machine Learning Toolbox™ обеспечивает функции и приложения, чтобы описать, анализировать, и данные модели. Можно использовать описательную статистику и графики для исследовательского анализа данных, подходящих распределений вероятностей к данным, сгенерировать случайные числа для симуляций Монте-Карло и выполнить тесты гипотезы. Регрессия и алгоритмы классификации позволяют вам чертить выводы из данных и создать прогнозирующие модели.

Для анализа многомерных данных Statistics and Machine Learning Toolbox обеспечивает выбор функции, пошаговую регрессию, анализ главных компонентов (PCA), регуляризацию и другие методы сокращения размерности, которые позволяют вам идентифицировать переменные или функции, которые влияют на вашу модель.

Тулбокс предоставляет контролируемые и безнадзорные алгоритмы машинного обучения, включая машины вектора поддержки (SVMs), повышенные и сложенные в мешок деревья решений, k - самого близкого соседа, k - средние значения, k-medoids, иерархическая кластеризация, Гауссовы модели смеси и скрытые модели Маркова. Многие алгоритмы статистики и машинного обучения могут использоваться для вычислений на наборах данных, которые являются слишком большими, чтобы храниться в памяти.

Начало работы

Изучите основы Statistics and Machine Learning Toolbox

Описательная статистика и визуализация

Импорт данных и экспорт, описательная статистика, визуализация

Распределения вероятностей

Модели частоты данных, генерация случайной выборки, оценка параметра

Тесты гипотезы

t-тест, F-тест, тест качества подгонки хи-квадрата, и больше

Кластерный анализ

Безнадзорные методы изучения, чтобы найти естественные группировки и шаблоны в данных

АНОВА

Дисперсионный анализ и ковариация, многомерная АНОВА, повторились, измеряет АНОВУ

Регрессия

Линейные, обобщенные линейные, нелинейные, и непараметрические методы для контролируемого изучения

Классификация

Контролируемые алгоритмы изучения для двоичного файла и проблем мультикласса

Сокращение размерности и выделение признаков

PCA, факторный анализ, показывают выбор, выделение признаков, и больше

Промышленная статистика

Проект экспериментов (DOE); выживание и анализ надежности; статистическое управление процессами

Анализ Больших данных с длинными массивами

Анализируйте данные, которые не помещаются в память,

Ускорьте статистические вычисления

Параллельное или распределенное вычисление статистических функций

Генерация кода

Сгенерируйте код C/C++ и MEX-функции для функций Statistics and Machine Learning Toolbox