histcounts

Количество интервалов гистограммы

Синтаксис

[N,edges]
= histcounts(X)

[N,edges]
= histcounts(X,nbins)

[N,edges]
= histcounts(X,edges)

[N,edges,bin]
= histcounts(___)

N = histcounts(C)

N = histcounts(C,Categories)

[N,Categories]
= histcounts(___)

[___] = histcounts(___,Name,Value)

Описание

пример

[N,edges] = histcounts(X) делит X значения в интервалы, и возвращают количество в каждом интервале, а также границы интервала. histcounts функционируйте использует автоматический алгоритм раскладывания, который возвращает интервалы с универсальной шириной, выбранной, чтобы покрыть область значений элементов в X и покажите базовую форму распределения.

пример

[N,edges] = histcounts(X,nbins) использование много интервалов, заданных скаляром, nbins.

пример

[N,edges] = histcounts(X,edges) виды X в интервалы с границами интервала, заданными вектором, edges. Значение X(i) находится в kинтервал th, если edges(k) ≤ X(i) <edges(k+1). Последний интервал также включает правильную границу интервала, так, чтобы это содержало X(i) если edges(end-1) ≤ X(i) ≤ edges(end).

пример

[N,edges,bin] = histcounts(___) также возвращает массив индекса, bin, использование любого из предыдущих синтаксисов. bin массив одного размера с X чьими элементами являются индексы интервала для соответствующих элементов в X. Число элементов в kинтервалом th является nnz(bin==k), который совпадает с N(k).

пример

N = histcounts(C), где C категориальный массив, возвращает вектор, N, это указывает на число элементов в C чье значение равно каждому Cкатегории. N имеет один элемент для каждой категории в C.

N = histcounts(C,Categories) количества только элементы в C чье значение равно подмножеству категорий, заданных Categories.

пример

[N,Categories] = histcounts(___) также возвращает категории, которые соответствуют каждому количеству в N использование любого из предыдущих синтаксисов для категориальных массивов.

пример

[___] = histcounts(___,Name,Value) дополнительные опции использования заданы одним или несколькими Name,Value парные аргументы с помощью любой из комбинаций аргументов ввода или вывода в предыдущих синтаксисах. Например, можно задать 'BinWidth' и скаляр, чтобы настроить ширину интервалов для числовых данных. Для категориальных данных можно задать 'Normalization' и любой 'count', 'countdensity', 'probability', 'pdf', 'cumcount', или 'cdf'.

Примеры

свернуть все

Количества интервала и края интервала

Скрипт Open Live Script

Распределите 100 случайных значений в интервалы. histcounts автоматически выбирает соответствующую ширину интервала, чтобы показать базовое распределение данных.

X = randn(100,1);
[N,edges] = histcounts(X)

N = 1×7

     2    17    28    32    16     3     2

edges = 1×8

    -3    -2    -1     0     1     2     3     4

Определение количества интервалов

Скрипт Open Live Script

Распределите 10 чисел в 6 равномерно распределенных интервалов.

X = [2 3 5 7 11 13 17 19 23 29];
[N,edges] = histcounts(X,6)

N = 1×6

     2     2     2     2     1     1

edges = 1×7

         0    4.9000    9.8000   14.7000   19.6000   24.5000   29.4000

Определение краев интервала

Скрипт Open Live Script

Распределите 1 000 случайных чисел в интервалы. Задайте границы интервала с вектором, где первым элементом является левый край первого интервала, и последним элементом является правый край последнего интервала.

X = randn(1000,1);
edges = [-5 -4 -2 -1 -0.5 0 0.5 1 2 4 5];
N = histcounts(X,edges)

N = 1×10

     0    24   149   142   195   200   154   111    25     0

Нормализованные количества интервала

Скрипт Open Live Script

Распределите все простые числа меньше чем 100 в интервалы. Задайте 'Normalization' как 'probability' нормировать количество интервалов так, чтобы sum(N) 1. Таким образом, каждое количество интервала представляет вероятность, что наблюдение находится в пределах того интервала.

X = primes(100);
[N,edges] = histcounts(X, 'Normalization', 'probability')

N = 1×4

    0.4000    0.2800    0.2800    0.0400

edges = 1×5

     0    30    60    90   120

Определение размещения интервала

Скрипт Open Live Script

Распределите 100 случайных целых чисел между-5 и 5 в интервалы и задайте 'BinMethod' как 'integers' использовать интервалы модульной ширины, сосредоточенные на целых числах. Задайте третий выход для histcounts возвратить вектор, представляющий индексы интервала данных.

X = randi([-5,5],100,1);
[N,edges,bin] = histcounts(X,'BinMethod','integers');

Найдите, что интервал значит третий интервал путем подсчета случаев номера 3 в интервале индексируют вектор, bin. Результат совпадает с N(3).

count = nnz(bin==3)

count = 8

Категориальные количества интервала

Скрипт Open Live Script

Создайте категориальный вектор, который представляет голоса. Категориями в векторе является 'yes', 'no', или 'undecided'.

A = [0 0 1 1 1 0 0 0 0 NaN NaN 1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 1];
C = categorical(A,[1 0 NaN],{'yes','no','undecided'})

C = 1x27 categorical
  Columns 1 through 9

     no      no      yes      yes      yes      no      no      no      no 

  Columns 10 through 16

     undecided      undecided      yes      no      no      no      yes 

  Columns 17 through 25

     no      yes      no      yes      no      no      no      yes      yes 

  Columns 26 through 27

     yes      yes

Определите число элементов, которые попадают в каждую категорию.

[N,Categories] = histcounts(C)

N = 1×3

    11    14     2

Categories = 1x3 cell
    {'yes'}    {'no'}    {'undecided'}

Входные параметры

свернуть все

`X` — Данные, чтобы распределить среди интервалов
вектор | матрица | многомерный массив

Данные, чтобы распределить среди интервалов в виде вектора, матрицы или многомерного массива. Если X не вектор, затем histcounts обработки это как вектор отдельного столбца, X(:).

histcounts игнорирует весь NaN значения. Точно так же histcounts игнорирует Inf и -Inf значения, если границы интервала явным образом не задают Inf или -Inf как граница интервала.

`C` — Категориальные данные
категориальный массив

Категориальные данные в виде категориального массива. histcounts игнорирует неопределенные категориальные значения.

Типы данных: categorical

`nbins` — Количество интервалов
положительное целое число

Количество интервалов в виде положительного целого числа. Если вы не задаете nbins, затем histcounts автоматически вычисляет сколько интервалов, чтобы использовать на основе значений в X.

Пример: [N,edges] = histcounts(X,15) использование 15 интервалов.

`edges` BinEdges
вектор

Границы интервала в виде вектора. edges(1) левый край первого интервала и edges(end) правый край последнего интервала.

Для datetime и данных о длительности, edges должен быть datetime или вектор длительности в монотонно увеличивающемся порядке.

`Categories` — Категории включены в количество
все категории (значение по умолчанию) | вектор ячейки из векторов символов | категориальный вектор

Категории, включенные в количество в виде вектора ячейки из векторов символов или категориального вектора. По умолчанию, histcounts использует интервал для каждой категории в категориальном массиве C. Используйте Categories задавать уникальное подмножество категорий вместо этого.

Пример: h = histcounts(C,{'Large','Small'}) количества только категориальные данные в категориях 'Large' и 'Small'.

Типы данных: cell | categorical

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: [N,edges] = histcounts(X,'Normalization','probability') нормирует количество интервалов в N, таким образом, что sum(N) 1.

`'BinLimits'` 'BinLimits'
двухэлементный вектор

Интервал ограничивает в виде двухэлементного вектора, [bmin,bmax]. Эта опция интервалы только значения в X то падение между bmin и bmax включительно; то есть, X(X>=bmin & X<=bmax).

Эта опция не применяется к категориальным данным.

Пример: [N,edges] = histcounts(X,'BinLimits',[1,10]) интервалы только значения в X это между 1 и 10 включительно.

`'BinMethod'` — Алгоритм раскладывания
`'auto'` (значение по умолчанию) | `'scott'` | `'fd'` | `'integers'` | `'sturges'` | `'sqrt'` | ...

Алгоритм раскладывания в виде одного из значений в этой таблице.

Значение	Описание
`'auto'`	`'auto'` по умолчанию алгоритм выбирает, ширина интервала, чтобы покрыть данные располагаются и показывают форму базового распределения.
`'scott'`	Правило Скотта оптимально, если данные близко к тому, чтобы быть нормально распределенным, но также подходят для большинства других распределений. Это использует ширину интервала `3.5std(X(:))numel(X)^(-1/3)`.
`'fd'`	Правило Фридмена—Диакониса менее чувствительно к выбросам в данных и может более подойти для данных с распределениями с тяжелым хвостом. Это использует ширину интервала `2IQR(X(:))numel(X)^(-1/3)`, где `IQR` межквартильный размах `X`.
`'integers'`	Целочисленное правило полезно с целочисленными данными, когда это создает интервал для каждого целого числа. Это использует ширину интервала 1 и помещает границы интервала на полпути между целыми числами. Чтобы предотвратить от случайного создания слишком многих интервалов, предел 65 536 интервалов ⁽²¹⁶⁾ может быть создан с этим правилом. Если область значений данных больше 65536, то более широкие интервалы используются вместо этого. Примечание `'integers'` не поддерживает данные о длительности или datetime.
`'sturges'`	Правило Стерджеса является простым правилом, которое популярно из-за его простоты. Это выбирает количество интервалов, чтобы быть `ceil(1 + log2(numel(X)))`.
`'sqrt'`	Правило Квадратного корня является другим простым правилом, широко использованным в других пакетах программного обеспечения. Это выбирает количество интервалов, чтобы быть `ceil(sqrt(numel(X)))`.

histcounts не всегда выбирает количество интервалов с помощью этих точных формул. Иногда количество интервалов настроено немного так, чтобы границы интервала упали на "хорошие" числа.

Для данных о datetime метод интервала может быть одним из этих модулей времени:

`'second'`	`'month'`
`'minute'`	`'quarter'`
`'hour'`	`'year'`
`'day'`	`'decade'`
`'week'`	`'century'`

Для данных о длительности метод интервала может быть одним из этих модулей времени:

`'second'`	`'day'`
`'minute'`	`'year'`
`'hour'`

Если вы задаете BinMethod с datetime или данными о длительности, затем histcounts может использовать максимум 65 536 интервалов (или ²¹⁶). Если заданная длительность интервала требует большего количества интервалов, то histcounts использует большую ширину интервала, соответствующую максимальному количеству интервалов.

Эта опция не применяется к категориальным данным.

Пример: [N,edges] = histcounts(X,'BinMethod','integers') интервалы использования сосредоточены на целых числах.

`'BinWidth'` — Ширина интервалов
скаляр

Ширина интервалов в виде скаляра. Если вы задаете BinWidth, затем histcounts может использовать максимум 65 536 интервалов (или ²¹⁶). Если заданная ширина интервала требует большего количества интервалов, то histcounts использует большую ширину интервала, соответствующую максимальному количеству интервалов.

Для datetime и данных о длительности, значения 'BinWidth' может быть скалярная длительность или календарная длительность.

Эта опция не применяется к категориальным данным.

Пример: [N,edges] = histcounts(X,'BinWidth',5) интервалы использования с шириной 5.

`'Normalization'` — Тип нормализации
`'count'` (значение по умолчанию) | `'probability'` | `'countdensity'` | `'pdf'` | `'cumcount'` | `'cdf'`

Тип нормализации в виде одного из значений в этой таблице. Для каждого интервала i:

$v_{i}$ значение интервала.
$c_{i}$ число элементов в интервале.
$w_{i}$ ширина интервала.
$N$ число элементов во входных данных. Это значение может быть больше сгруппированных данных, если данные содержат NaNNAT, или <undefined> значения, или если некоторые данные находятся вне пределов интервала.

Значение	Значения интервала	Примечания
`'count'` (значение по умолчанию)	$v_{i} = c_{i}$	Количество или частота наблюдений. Сумма значений интервала меньше чем или равна `numel(X)`. Сумма меньше `numel(X)` только, когда некоторые входные данные не включены в интервалы. Для категориальных данных суммой значений интервала является любой `numel(X)` или `sum(ismember(X(:),Categories))`.
`'countdensity'`	$v_{i} = \frac{c_{i}}{w_{i}}$	Количество или частота, масштабируемая шириной интервала. Для категориальных данных, это то же самое как `'count'`. Примечание `'countdensity'` не поддерживает данные о длительности или datetime.
`'cumcount'`	$v_{i} = \sum_{j = 1}^{i} c_{j}$	Совокупное количество. Каждое значение интервала является совокупным числом наблюдений в том интервале и всех предыдущих интервалах. Значение последнего интервала меньше чем или равно `numel(X)`. Для категориальных данных значение последнего интервала меньше чем или равно `numel(X)` или `sum(ismember(X(:),Categories))`.
`'probability'`	$v_{i} = \frac{c_{i}}{N}$	Относительная вероятность. Сумма значений интервала меньше чем или равна `1`.
`'pdf'`	$v_{i} = \frac{c_{i}}{N \cdot w_{i}}$	Оценка функции плотности вероятности. Для категориальных данных это совпадает с `'probability'`. Примечание `'pdf'` не поддерживает данные о длительности или datetime.
`'cdf'`	$v_{i} = \sum_{j = 1}^{i} \frac{c_{j}}{N}$	Совокупная оценка функции плотности. `N(end)` меньше чем или равно `1`.

Пример: [N,edges] = histcounts(X,'Normalization','pdf') интервалы данные с помощью оценки функции плотности вероятности.

Выходные аргументы

свернуть все

`N` bincounts
вектор-строка

Количество интервалов, возвращенное как вектор-строка.

`edges` BinEdges
вектор

Границы интервала, возвращенные как вектор. edges(1) левый край первого интервала и edges(end) правый край последнего интервала.

`bin` — Индексы интервала
массив

Индексы интервала, возвращенные как массив одного размера с X. Каждый элемент в bin описывает, который пронумеровал интервал, содержит соответствующий элемент в X.

Значение 0 в bin указывает на элемент, который не принадлежит ни одному из интервалов (например, NaN значение.

`Categories` — Категории включены в количество
вектор ячейки из векторов символов

Категории включены в количество, возвращенное как вектор ячейки из векторов символов. Categories содержит категории в C это соответствует каждому количеству в N.

Советы

Поведение histcounts похоже на тот из discretize функция. Использование histcounts найти число элементов в каждом интервале. С другой стороны, использовать discretize найти, какой интервал каждый элемент принадлежит (не рассчитывая).

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Указания и ограничения по применению:

Некоторые входные опции не поддерживаются. Позволенные опции:
- 'BinWidth'
- 'BinLimits'
- 'Normalization'
- 'BinMethod' — 'auto' и 'scott' методы интервала являются тем же самым. 'fd' метод интервала не поддерживается.

Для получения дополнительной информации см. Раздел "Высокие массивы".

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Указания и ограничения по применению:

Генерация кода не поддерживает входные параметры разреженной матрицы для этой функции.
Если вы не предоставляете границы интервала, то генерация кода может потребовать массивов переменного размера и динамического выделения памяти.

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Указания и ограничения по применению:

Генерация кода не поддерживает входные параметры разреженной матрицы для этой функции.
Если вы не предоставляете границы интервала, то генерация кода может потребовать массивов переменного размера и динамического выделения памяти.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Указания и ограничения по применению:

64-битные целые числа не поддерживаются.

Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).

Документация

histcounts

Синтаксис

Описание

Примеры

Количества интервала и края интервала

Определение количества интервалов

Определение краев интервала

Нормализованные количества интервала

Определение размещения интервала

Категориальные количества интервала

Входные параметры

`X` — Данные, чтобы распределить среди интервалов
вектор | матрица | многомерный массив

`C` — Категориальные данные
категориальный массив

`nbins` — Количество интервалов
положительное целое число

`edges` BinEdges
вектор

`Categories` — Категории включены в количество
все категории (значение по умолчанию) | вектор ячейки из векторов символов | категориальный вектор

Аргументы в виде пар имя-значение

`'BinLimits'` 'BinLimits'
двухэлементный вектор

`'BinMethod'` — Алгоритм раскладывания
`'auto'` (значение по умолчанию) | `'scott'` | `'fd'` | `'integers'` | `'sturges'` | `'sqrt'` | ...

`'BinWidth'` — Ширина интервалов
скаляр

`'Normalization'` — Тип нормализации
`'count'` (значение по умолчанию) | `'probability'` | `'countdensity'` | `'pdf'` | `'cumcount'` | `'cdf'`

Выходные аргументы

`N` bincounts
вектор-строка

`edges` BinEdges
вектор

`bin` — Индексы интервала
массив

`Categories` — Категории включены в количество
вектор ячейки из векторов символов

Советы

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Темы

Документация MATLAB

Поддержка

Документация

histcounts

Синтаксис

Описание

Примеры

Количества интервала и края интервала

Определение количества интервалов

Определение краев интервала

Нормализованные количества интервала

Определение размещения интервала

Категориальные количества интервала

Входные параметры

X — Данные, чтобы распределить среди интервалов вектор | матрица | многомерный массив

C — Категориальные данные категориальный массив

nbins — Количество интервалов положительное целое число

edges BinEdges вектор

Categories — Категории включены в количество все категории (значение по умолчанию) | вектор ячейки из векторов символов | категориальный вектор

Аргументы в виде пар имя-значение

'BinLimits' 'BinLimits' двухэлементный вектор

'BinMethod' — Алгоритм раскладывания 'auto' (значение по умолчанию) | 'scott' | 'fd' | 'integers' | 'sturges' | 'sqrt' | ...

'BinWidth' — Ширина интервалов скаляр

'Normalization' — Тип нормализации 'count' (значение по умолчанию) | 'probability' | 'countdensity' | 'pdf' | 'cumcount' | 'cdf'

Выходные аргументы

N bincounts вектор-строка

edges BinEdges вектор

bin — Индексы интервала массив

Categories — Категории включены в количество вектор ячейки из векторов символов

Советы

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++ Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Массивы графического процессора Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Темы

Документация MATLAB

Поддержка

`X` — Данные, чтобы распределить среди интервалов
вектор | матрица | многомерный массив

`C` — Категориальные данные
категориальный массив

`nbins` — Количество интервалов
положительное целое число

`edges` BinEdges
вектор

`Categories` — Категории включены в количество
все категории (значение по умолчанию) | вектор ячейки из векторов символов | категориальный вектор

`'BinLimits'` 'BinLimits'
двухэлементный вектор

`'BinMethod'` — Алгоритм раскладывания
`'auto'` (значение по умолчанию) | `'scott'` | `'fd'` | `'integers'` | `'sturges'` | `'sqrt'` | ...

`'BinWidth'` — Ширина интервалов
скаляр

`'Normalization'` — Тип нормализации
`'count'` (значение по умолчанию) | `'probability'` | `'countdensity'` | `'pdf'` | `'cumcount'` | `'cdf'`

`N` bincounts
вектор-строка

`edges` BinEdges
вектор

`bin` — Индексы интервала
массив

`Categories` — Категории включены в количество
вектор ячейки из векторов символов

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Генерация кода C/C++
Генерация кода C и C++ с помощью MATLAB® Coder™.

Генерация кода графического процессора
Сгенерируйте код CUDA® для NVIDIA® графические процессоры с помощью GPU Coder™.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.