Класс: набор данных
(Не Рекомендуемый) сводные данные Печати массива набора данных
dataset
тип данных не рекомендуется. Чтобы работать с гетерогенными данными, используйте MATLAB®
table
тип данных вместо этого. Смотрите MATLAB table
документация для получения дополнительной информации.
summary(A)
s = summary(A)
summary(A)
распечатывает сводные данные массива набора данных и переменных, которые это содержит.
s = summary(A)
возвращает скалярную структуру s
это содержит сводные данные набора данных A
и переменные, что A
содержит. Для получения дополнительной информации о полях в s
, смотрите Выходные параметры.
Итоговая информация зависит от типа переменных в наборе данных:
Для числовых переменных, summary
вычисляет сводные данные с пятью номерами данных, давая минимум, первый квартиль, медиану, третий квартиль и максимум.
Для логических переменных, summary
считает количество true
s и false
s в данных.
Для категориальных переменных, summary
считает количество данных на каждом уровне.
Следующий список описывает поля в структуре s
:
Description
— Символьный массив, содержащий описание набора данных.
Variables
— Массив структур с одним элементом для каждой переменной набора данных в A. Каждый элемент имеет следующие поля:
Name
— Вектор символов, содержащий имя переменной.
Description
— Вектор символов, содержащий описание переменной.
Units
— Вектор символов, содержащий модули переменной.
Size
— Числовой вектор, содержащий размер переменной.
Class
— Вектор символов, содержащий класс переменной.
Data
— Скалярная структура, содержащая следующие поля.
Для числовых переменных:
Probabilities
— Числовой вектор, содержащий вероятности [0.0.25.50.75 1.0] и NaN (если кто-либо присутствует в соответствующей переменной набора данных).
Quantiles
— Числовой вектор, содержащий значения, которые соответствуют 'Вероятностям' для соответствующей переменной набора данных и количеству NaNs (если кто-либо присутствует).
Для логических переменных:
Values
— Логический вектор [истинная ложь].
Counts
— Числовой вектор из счетов для каждого логического значения.
Для категориальных переменных:
Levels
— Массив ячеек, содержащий метки для каждого уровня соответствующей переменной набора данных.
Counts
— Числовой вектор из счетов для каждого уровня.
'Data'
пусто, если переменная не является числовой, категориальной, или логической. Если переменная набора данных имеет больше чем один столбец, то соответствующий 'Quantiles'
или 'Counts'
поле является матрицей или массивом.
Обобщите ирисовые данные Фишера:
load fisheriris species = nominal(species); data = dataset(species,meas); summary(data) species: [150x1 nominal] setosa versicolor virginica 50 50 50 meas: [150x4 double] min 4.3000 2 1 0.1000 1st Q 5.1000 2.8000 1.6000 0.3000 median 5.8000 3 4.3500 1.3000 3rd Q 6.4000 3.3000 5.1000 1.8000 max 7.9000 4.4000 6.9000 2.5000
Обобщите данные в hospital.mat
:
load hospital summary(hospital) Dataset array created from the data file hospital.dat. The first column of the file ("id") is used for observation names. Other columns ("sex" and "smoke") have been converted from their original coded values into categorical and logical variables. Two sets of columns ("sys" and "dia", "trial1" through "trial4") have been combined into single variables with multivariate observations. Column headers have been replaced with more descriptive variable names. Units have been added where appropriate. LastName: [100x1 cell array of character vectors] Sex: [100x1 nominal] Female Male 53 47 Age: [100x1 double, Units = Yrs] min 1st Q median 3rd Q max 25 32 39 44 50 Weight: [100x1 double, Units = Lbs] min 1st Q median 3rd Q max 111 130.5000 142.5000 180.5000 202 Smoker: [100x1 logical] true false 34 66 BloodPressure: [100x2 double, Units = mm Hg] Systolic/Diastolic min 109 68 1st Q 117.5000 77.5000 median 122 81.5000 3rd Q 127.5000 89 max 138 99 Trials: [100x1 cell, Units = Counts] From zero to four measurement trials performed