Методов преобразования признаков уменьшают размерность данных путем преобразования данных в новые возможности. Методы выбора признаков предпочтительны, когда преобразование переменных невозможно, например, когда в данных есть категориальные переменные. Для метода выбора признаков, который специально подходит для подбора кривой методом наименьших квадратов, смотрите Ступенчатая Регрессия.
Узнайте об алгоритмах выбора признаков и исследуйте функции, доступные для выбора объектов.
Последовательный выбор признаков
В этом разделе описывается последовательный выбор признаков и приводится пример, который выбирает функции последовательно с помощью пользовательского критерия и sequentialfs
функция.
Анализ компонентов по соседству (NCA) Выбора признаков
Анализ компонента окрестности (NCA) является непараметрическим методом для выбора функций с целью максимизации точности предсказания алгоритмов регрессии и классификации.
Упорядочение классификатора дискриминантного анализа
Создайте более устойчивую и более простую модель путем удаления предикторов, не ставя под угрозу прогнозирующую степень модели.
Выберите предикторы для случайных лесов
Выберите предикторы разделения для случайных лесов с помощью алгоритма тестирования взаимодействия.
Редукция данных является набором методов для извлечения высокоуровневых функций из данных.
Рабочий процесс редукции данных
Этот пример показывает полный рабочий процесс редукции данных из данных изображения.
В этом примере показано, как использовать rica
для распутывания смешанных аудиосигналов.
t-SNE является методом визуализации высокомерных данных путем нелинейного сокращения до двух или трёх размерностей с сохранением некоторых функций исходных данных.
Визуализация высоко-размерных данных с помощью t-SNE
В этом примере показано, как t-SNE создает полезное маломерное вложение высоко-размерных данных.
Этот пример показывает эффекты различных tsne
настройки.
Описание выходной функции и пример для t-SNE.
Анализ основных компонентов (PCA)
Анализ основных компонентов уменьшает размерность данных, заменяя несколько коррелированных переменных на новый набор переменных, которые являются линейными комбинациями исходных переменных.
Анализ качества жизни в городах США с помощью PCA
Выполните анализ взвешенных основных компонентов и интерпретируйте результаты.
Факторный анализ является способом подгонки модели к многомерным данным для оценки взаимозависимости измеренных переменных с меньшим количеством незащищенных (латентных) факторов.
Анализ цен на акции с помощью факторного анализа
Используйте факторный анализ, чтобы выяснить, испытывают ли компании в том же секторе аналогичные изменения цен на акции от недели к неделе.
Выполните анализ фактора на экзаменационных оценках
В этом примере показов, как выполнить анализ фактора с помощью Statistics and Machine Learning Toolbox™.
Неотрицательная матричная факторизация
Nonnegative matrix factorization (NMF) является методом уменьшения размерности, основанным на низкоранговом приближении пространства функций.
Выполните неотрицательную матричную факторизацию
Выполните неотрицательную матричную факторизацию, используя мультипликативный и переменный алгоритмы наименьших квадратов.
Многомерное масштабирование позволяет вам визуализировать, как близко точки находятся друг к другу для многих видов метрик расстояния или неоднородности, и может создать представление данных в небольшом количестве размерностей.
Классическое многомерное масштабирование
Использование cmdscale
для выполнения классического (метрического) многомерного масштабирования, также известного как анализ основных координат.
Классическое многомерное масштабирование, примененное к непространственным расстояниям
В этом примере показано, как выполнить классическое многомерное масштабирование с помощью cmdscale
функция в Statistics and Machine Learning Toolbox™.
Неклассическое многомерное масштабирование
Этот пример показывает, как визуализировать данные о различии с помощью неклассических форм многомерного масштабирования (MDS).
Неклассическое и неметрическое многомерное масштабирование
Выполните неклассическое многомерное масштабирование с помощью mdscale
.
Анализ Procrustes минимизирует различия в местоположении между сравненными историческими данными, используя лучшие евклидовы преобразования, сохраняющие форму.
Сравнение рукописных фигур с помощью анализа Procrustes
Используйте анализ Procrustes, чтобы сравнить две рукописные цифры.