Преимущества Использования номинальных и порядковых массивов

Примечание

nominal и типы данных массива ordinal могут быть удалены в будущем релизе. Чтобы представлять упорядоченный и неупорядоченные дискретные, нечисловые данные, используйте Категориальные массивы (MATLAB) тип данных вместо этого.

Управляйте уровнями категории

При работе с категориальными переменными и их уровнями, вы столкнетесь с некоторыми типичными проблемами. Эта таблица суммирует функции, которые можно использовать с номинальными или порядковыми массивами, чтобы управлять уровнями категории. Для дополнительных функций введите methods nominal или methods ordinal в командной строке, или смотрите страницы с описанием ordinal и nominal.

ЗадачаФункция
Добавьте новые уровни категории addlevels
Пропустите уровни категорииdroplevels
Объедините уровни категорииmergelevels
Переупорядочьте уровни категорииreorderlevels
Считайте количество наблюдений в каждой категорииlevelcounts
Измените метку или имя уровней категорииsetlabels
Создайте фактор взаимодействияtimes
Найдите наблюдения, которые не находятся в заданной категорииisundefined

Анализ Используя номинальные и порядковые массивы

Можно использовать номинальные и порядковые массивы во множестве статистических анализов. Например, вы можете хотеть вычислить описательную статистику для данных, сгруппированных уровнями категории, провести статистические тесты на различиях между средними значениями категории или выполнить регрессионный анализ с помощью категориальных предикторов.

Функции Statistics and Machine Learning Toolbox™, которые принимают группирующую переменную как входной параметр, принимают номинальные и порядковые массивы. Это включает описательные функции, такие как:

Можно также использовать номинальные и порядковые массивы в качестве входных параметров к аналитическим функциям и методам на основе моделей, таких как:

Когда вы используете номинальный или порядковый массив в качестве предиктора в этих функциях, подходящая функция автоматически распознает категориальный предиктор и создает соответствующие фиктивные переменные индикатора для анализа. Также можно создать собственные фиктивные переменные индикатора с помощью dummyvar.

Сокращение требований к памяти

Уровни категориальных переменных часто задаются как текст, который может быть дорогостоящим, чтобы сохранить и управлять в массиве char или массиве ячеек из символьных векторов. Номинальные и порядковые массивы отдельно хранят членство в категории и подписи категорий, значительно уменьшая объем памяти, требуемый сохранить переменную.

Например, загрузите некоторые выборочные данные:

load('fisheriris')
Переменная species является массивом ячеек из символьных векторов, требующим 19 300 байтов памяти.

Преобразуйте species в номинальный массив:

species = nominal(species);

Существует 95%-е сокращение памяти, требуемой сохранить переменную.

Смотрите также

|

Связанные примеры

Больше о