Statistics and Machine Learning Toolbox

Анализируйте и моделируйте данные с помощью статистики и машинного обучения

Statistics and Machine Learning Toolbox™ предоставляет функции и приложения для описания, анализа и моделирования данных. Вы можете использовать описательную статистику и графики для исследовательского анализа данных, подгонять распределения вероятностей к данным, генерировать случайные числа для моделирования методом Monte Carlo и выполнять проверку гипотез. Алгоритмы регрессии и классификации позволяют делать выводы из данных и строить прогнозные модели.

Для анализа многомерных данных Statistics and Machine Learning Toolbox обеспечивает выбор признаков, ступенчатую регрессию, анализ главных компонентов (PCA), регуляризацию и другие методы сокращения размерности, которые позволяют вам идентифицировать переменные или функции, которые влияют на вашу модель.

Тулбокс предоставляет алгоритмы машинного обучения с учителем и без учителя, включая машины опорных векторов (SVMs), бустинг и баггинг деревьев решений, k - ближайших соседей, k - средние значения, k-medoids, иерархическая кластеризация, Гауссовы модели смеси и скрытые модели Маркова. Многие алгоритмы статистики и машинного обучения могут использоваться для вычислений на наборах данных, которые являются слишком большими, чтобы храниться в памяти.

Начало работы

Изучите основы Statistics and Machine Learning Toolbox

Описательная статистика и визуализация

Импорт и экспорт данных, описательная статистика, визуализация

Вероятностные распределения

Модели частоты данных, генерация случайной выборки, оценка параметра

Тесты гипотезы

t-тест, F-тест, критерий согласия Хи-квадрат и другие

Кластерный анализ

Безнадзорные методы изучения, чтобы найти естественные группировки и шаблоны в данных

ДИСПЕРСИОННЫЙ АНАЛИЗ

Дисперсионный анализ и ковариационный анализ, многомерный дисперсионный анализ, дисперсионный анализ с повторными измерениями

Регрессия

Линейные, обобщенные линейные, нелинейные, и непараметрические методы для контролируемого изучения

Классификация

Алгоритмы контролируемого обучения для бинарных и многоклассовых задач

Сокращение размерности и извлечение признаков

PCA, факторный анализ, выбор признаков, извлечение признаков и другие

Промышленная статистика

Проект экспериментов (DOE); выживание и анализ надежности; статистическое управление процессами

Анализ Больших данных с длинными массивами

Анализируйте данные, которые не помещаются в память,

Ускорьте статистические расчеты

Параллельный или распределенный расчет статистических функций

Генерация кода

Сгенерируйте код C/C++ и MEX-функции для функций Statistics and Machine Learning Toolbox