Массив, который содержит значения, присвоенные категориям
categorical
является типом данных, который присваивает значения конечному набору дискретных категорий, таких как High
, Med
, и Low
. Эти категории могут иметь математическое упорядоченное расположение, который вы задаете, такой как High > Med > Low
, но это не обязательно. Категориальный массив обеспечивает эффективное хранение и удобную манипуляцию нечисловыми данными, а также сохраняет значимые имена для значений. Обычно категориальные массивы используются для задания групп строк в таблице.
B = categorical(
создает категориальный массив из массива A
)A
. Категории B
отсортированные уникальные значения из A
.
B = categorical(
создает по одной категории для каждого значения в A
,valueset
)valueset
. Категории B
находятся в том же порядке, что и значения valueset
.
Можно использовать valueset
для включения категорий значений, отсутствующих в A
. И наоборот, если A
содержит любые значения, отсутствующие в valueset
, затем соответствующие элементы B
не определены.
B = categorical(
создает категориальный массив с дополнительными опциями, заданными одним или несколькими A
,___,Name,Value
)Name,Value
аргументы в виде пар. Можно включать любой из входных параметров в предыдущие синтаксисы.
Для примера, чтобы указать, что категории имеют математическое упорядоченное расположение, задайте 'Ordinal',true
.
Список функций, которые принимают или возвращают категориальные массивы, см. в разделе Категориальные массивы.
Если массив входа имеет числовые, datetime или значения длительности, которые слишком близки друг к другу, то categorical
функция обрезает их, чтобы повторить значения. Для примера, categorical([1 1.00001])
обрезает второй элемент массива входа. Чтобы создать категории из числовых данных, используйте discretize
функция.
Вы также можете сгруппировать числовые данные в категории, используя discretize
.