статистика::

Соответствуйте числовым данным в частоты количества и классы

Блокноты MuPAD® будут демонтированы в будущем релизе. Используйте live скрипты MATLAB® вместо этого.

Live скрипты MATLAB поддерживают большую часть функциональности MuPAD, хотя существуют некоторые различия. Для получения дополнительной информации смотрите, Преобразовывают Notebook MuPAD в Live скрипты MATLAB.

Синтаксис

stats::frequency(data, <ClassesClosed = Left | Right>)
stats::frequency(data, n, <ClassesClosed = Left | Right>)
stats::frequency(data, [n], <ClassesClosed = Left | Right>)
stats::frequency(data, [a1 .. b1, a2 .. b2, …], <ClassesClosed = Left | Right>)
stats::frequency(data, [[a1, b1], [a2, b2], …], <ClassesClosed = Left | Right>)
stats::frequency(data, Classes = n, <ClassesClosed = Left | Right>)
stats::frequency(data, Classes = [n], <ClassesClosed = Left | Right>)
stats::frequency(data, Classes = [a1 .. b1, a2 .. b2, …], <ClassesClosed = Left | Right>)
stats::frequency(data, Classes = [[a1, b1], [a2, b2], …], <ClassesClosed = Left | Right>)
stats::frequency(data, Cells = n, <CellsClosed = Left | Right>)
stats::frequency(data, Cells = [n], <CellsClosed = Left | Right>)
stats::frequency(data, Cells = [a1 .. b1, a2 .. b2, …], <CellsClosed = Left | Right>)
stats::frequency(data, Cells = [[a1, b1], [a2, b2], …], <CellsClosed = Left | Right>)

Описание

stats::frequency(data, [[a1, b1], [a2, b2], …]) соответствует числовым данным в различные классы, данные полуоткрытыми интервалами. Это рассчитывает, сколько элементов данных попадает в каждый класс.

Все элементы данных должны быть действительными численными значениями. Точные численные значения, такие как π, и т.д. позволены, если они могут быть преобразованы в действительные числа с плавающей запятой через float. Ошибка повышена, если символьные данные найдены, что это не может быть преобразовано в действительные числа с плавающей точкой.

Примечание

Обратите внимание на то, что stats::frequency быстр, если все элементы данных являются целыми числами, рациональными числами или числами с плавающей точкой. Точные численные значения, такие как π, и т.д. обрабатываются, но оказывают значимое влияние на эффективность stats::frequency.

Данные, данные массивом, таблица и т.д. внутренне обработана как список, содержащий все операнды контейнера данных. В частности, все строки и столбцы массивов, матриц и объектов stats::sample учтены. Объект stats::sample не должен содержать вводы текста.

Для спецификации классов stats::frequency принимает или одно положительное целое число (или, эквивалентно, список одного положительного целого числа) или список классов, данных как области значений или списки двух элементов.

Один целочисленный n в спецификации, Classes= n или Classes= [n] интерпретированы как, “подразделяет диапазон от min (data) к max (data) в классы n равного размера”. Левая граница первого класса установлена в - ∞.

Классы могут быть заданы непосредственно как в Classes = [[a1, b1], [a2, b2], …] или Classes=[a_1..b_1, a_2..b_2, dots].

Примечание

С настройкой по умолчанию ClassesClosed = Right i-th класс является полуоткрытым интервалом, т.е. данной величиной, x соответствуют в i-th класс, если a i <xb i удовлетворен.

С ClassesClosed = Left i-th класс является полуоткрытым интервалом, т.е. данной величиной, x соответствуют в i-th класс, если a ix <b i удовлетворен.

Контуры класса должны быть числовыми действительными значениями, удовлетворяющими a 1b 1a 2b 2a 3 ≤ …. В большинстве приложений, b 1 = a 2, b 2 = a 3 и т.д. является соответствующим.

Точные значения, такие как π, и т.д. приняты и обработаны.

Классы не должны покрывать целую область значений данных. Данные проигнорированы, если они не попадают в один из заданных классов.

При предоставлении классов непосредственно, крайняя левая граница может быть - ∞, и самой правой границей может быть infinity.

Примеры

Пример 1

Мы разделяем следующие данные в 10 классов равного размера (значение по умолчанию). Первый класс покрывает значения от - ∞ к 2:

data := [0, 1, 2, PI, 4, 5, 6, 7, 7.1, 20]:
T := stats::frequency(data)

Мы разделяем информацию о классах в 3 отдельных таблицы:

TheClasses = map(T, op, 1)

TheFrequencies = map(T, op, 2)

TheValues = map(T, op, 3)

Классы заданы явным образом:

classes:= [[0, 5], [5, 10], [10, 20]]:
stats::frequency(data, classes)

Обратите внимание на то, что значению 0 не соответствуют ни в один из классов (первый класс представляет полуоткрытый интервал)! В порядке включать все значения, мы используем в качестве контуров класса:

classes:= [[-infinity, 5], [5, 10], [10, infinity]]:
stats::frequency(data, classes)

delete data, T, classes:

Пример 2

Мы демонстрируем различие между опциями ClassesClosed = Left и ClassesClosed = Right. В первом случае значению 1 соответствуют во второй класс:

stats::frequency([0, 1, 2], Classes = [-infinity..1, 1..infinity],
                          ClassesClosed = Left)

С ClassesClosed = Right значению 1 соответствуют в первый класс:

stats::frequency([0, 1, 2], Classes = [-infinity..1, 1..infinity],
                          ClassesClosed = Right)

Настройкой по умолчанию является ClassesClosed = Right:

stats::frequency([0, 1, 2], Classes = [-infinity..1, 1..infinity])

Пример 3

Мы создаем выборку 1 000 нормально распределенных точек данных:

X := stats::normalRandom(0, 10):
data := [X() $ i = 1..1000]:

Этим данным соответствуют в 5 различных классов равной ширины:

T := stats::frequency(data, 5):

Мы определяем количество значений данных в каждом классе:

for i from 1 to 5 do
    print(Class = T[i][1], NumberOfElements = T[i][2]);
end_for:

Мы определяем выбросы выборки данных путем сбора значений, меньших, чем - 9 и значений, больше, чем 10:

classes := [[-infinity, -9], [10, infinity]]:
T := stats::frequency(data, classes);

delete X, data, T, i, classes:

Параметры

data

Статистические данные: список, набор, таблица, массив, матрица или объект типа stats::sample, содержащий числовые действительные значения данных

n

Количество классов (ячейки): положительное целое число. Если не заданный, n = 10 используется.

a1, b1, a2, …

Контуры класса: действительное удовлетворение численных значений

.

Также позволены как контуры класса.

Возвращаемые значения

таблица возвращена с целочисленными индексами от 1 до количества классов. i-th запись таблицы T = stats::frequency(data, ...) является списком T[i] = [[a i, b i], n i, [v 1, v 2, …]], где [a i, b i] является i-th класс, n, i является количеством данных, падающих в этом классе, и [v 1, v 2, …] является отсортированным списком всех данных в этом классе (т.е. a i <v jb j для всего j от 1 до n i).

Смотрите также

Функции MuPAD

MuPAD графические примитивы