Сгруппировать данные в интервалы или категории
возвращает индексы интервалов, которые содержат элементы Y
= discretize(X
,edges
)X
. j
интервал th содержит элемент X(i)
если edges(j) <= X(i) < edges(j+1)
для 1 <= j < N
, где N
количество интервалов и length(edges) = N+1
. Последний интервал содержит оба ребра, таким образом что edges(N) <= X(i) <= edges(N+1)
.
[___] = discretize(___,
возвращает соответствующий элемент в values
)values
вместо номера интервала, с помощью любой из предыдущих комбинаций аргументов ввода или вывода. Например, если X(1)
находится в интервале 5, затем Y(1)
values(5)
вместо 5
Значения
должен быть вектор с длиной, равной количеству интервалов.
[___] = discretize(___,'categorical')
создает категориальный массив, где каждый интервал является категорией. В большинстве случаев названия категории по умолчанию имеют форму “[A,B)
” (или “[A,B]
” для последнего интервала), где A
и B
последовательные границы интервала. Если вы задаете dur
как вектор символов, затем названия категории по умолчанию могут иметь специальные форматы. Смотрите Y
для списка форматов отображения.
[___] = discretize(___,'categorical',
, для datetime или входных параметров длительности массивов, использует заданный datetime или формат отображения длительности в названиях категории выхода.displayFormat
)
[___] = discretize(___,'categorical',
также называет категории в categoryNames
)Y
с помощью массива ячеек из символьных векторов, categoryNames
. Длина categoryNames
должно быть равно количеству интервалов.
[___] = discretize(___,'IncludedEdge',
, где side
)side
'left'
или 'right'
, задает, включает ли каждый интервал свою правильную или левую границу интервала. Например, если side
'right'
, затем каждый интервал включает правильную границу интервала, за исключением первого интервала, который включает оба ребра. В этом случае, j
интервал th содержит элемент X(i)
если edges(j) < X(i) <= edges(j+1)
, где 1 < j <= N
и N
количество интервалов. Первый интервал включает левый край, таким образом, что это содержит edges(1) <= X(i) <= edges(2)
. Значение по умолчанию для side
'left'
.
Поведение discretize
похоже на тот из histcounts
функция. Использование histcounts
найти число элементов в каждом интервале. С другой стороны, использовать discretize
найти, какой интервал каждый элемент принадлежит (не рассчитывая).