Сгруппировать данные в интервалы или категории
возвращает индексы интервалов, которые содержат элементы Y
= discretize(X
,edges
)X
. The j
th bin содержит элемент X(i)
если edges(j) <= X(i) < edges(j+1)
для 1 <= j < N
, где N
количество интервалов и length(edges) = N+1
. Последний интервал содержит обоих ребер, такие что edges(N) <= X(i) <= edges(N+1)
.
[
, где Y
,E
] =
discretize(X
,dur
)X
является массивом datetime или длительностью, делит X
в равномерные интервалы dur
интервал времени. dur
может быть скаляр duration
или calendarDuration
или модуль времени. Для примера, [Y,E] = discretize(X,'hour')
делит X
в интервалы с равномерной длительности в 1 часа.
[___] = discretize(___,
возвращает соответствующий элемент в values
)values
вместо номера интервала, используя любую из предыдущих комбинаций входных или выходных аргументов. Для примера, если X(1)
находится в интервале 5, затем Y(1)
является values(5)
а не 5
. values
должен быть вектором с длиной, равной количеству интервалов.
[___] = discretize(___,'categorical')
создает категориальный массив, где каждый интервал является категорией. В большинстве случаев имена категорий по умолчанию имеют форму "[A,B)
«(или» [A,B]
"для последнего интервала), где A и
B
являются последовательными границами интервала. Если вы задаете dur
как векторы символов, имена категорий по умолчанию могут иметь специальные форматы. См. Y
для получения списка форматов отображения.
[___] = discretize(___,'categorical',
для входов массива datetime или duration использует заданный формат отображения datetime или duration в именах категорий выхода.displayFormat
)
[___] = discretize(___,'categorical',
также называет категории в categoryNames
)Y
использование массива ячеек из векторов символов, categoryNames
. Длина categoryNames
должно быть равно количеству интервалов.
[___] = discretize(___,'IncludedEdge',
, где side
)side
является 'left'
или 'right'
, определяет, включает ли каждый интервал правую или левую границу интервала. Для примера, если side
является 'right'
затем каждое интервал включает правую границу интервала, за исключением первого интервала, который включает обоих ребер. В этом случае j
th bin содержит элемент X(i)
если edges(j) < X(i) <= edges(j+1)
, где 1 < j <= N
и N
количество интервалов. Первый интервал включает левый край, таким образом, что он содержит edges(1) <= X(i) <= edges(2)
. Значение по умолчанию для side
является 'left'
.
Поведение discretize
аналогично тому, как в histcounts
функция. Использовать histcounts
для поиска количества элементов в каждом интервале. С другой стороны, используйте discretize
найти, к какому интервалу принадлежит каждый элемент (без подсчета).