Массив, который содержит значения, присвоенные категориям
categorical
является типом данных, который присваивает значения конечному множеству дискретных категорий, такие как High
, Med
и Low
. Эти категории могут иметь математическое упорядоченное расположение, чтобы вы задали, такие как High > Med > Low
, но он не требуется. Категориальный массив обеспечивает эффективное устройство хранения данных и удобную манипуляцию нечисловых данных, также поддерживая понятные имена для значений. Общее использование категориальных массивов должно задать группы строк в таблице.
B = categorical(A)
B = categorical(A,valueset)
B = categorical(A,valueset,catnames)
B = categorical(A,___,Name,Value)
B = categorical(
создает категориальный массив из массива A
)A
. Категории B
являются отсортированными уникальными значениями от A
.
B = categorical(
создает одну категорию для каждого значения в A
,valueset
)valueset
. Категории B
находятся в том же порядке как значения valueset
.
Можно использовать valueset
, чтобы включать категории для значений, не существующих в A
. С другой стороны, если A
содержит какие-либо значения, не существующие в valueset
, то соответствующие элементы B
не определены.
B = categorical(
создает категориальный массив с дополнительными опциями, заданными одним или несколькими аргументами пары A
,___,Name,Value
)Name,Value
. Можно включать любой из входных параметров в предыдущих синтаксисах.
Например, чтобы указать, что категории имеют математическое упорядоченное расположение, задайте 'Ordinal',true
.
Для списка функций, которые принимают или возвращают категориальные массивы, см. Категориальные массивы.
Если входной массив имеет числовой, datetime или значения длительности, которые слишком близки вместе, то функция categorical
обрезает их, чтобы копировать значения. Например, categorical([1 1.00001])
обрезает второй элемент входного массива. Чтобы создать категории из числовых данных, используйте функцию discretize
.
Также можно сгруппировать числовые данные в категории с помощью discretize
.