Класс: набор данных
(Не рекомендуется) Печать сводки массива наборов данных
dataset тип данных не рекомендуется. Для работы с разнородными данными используйте MATLAB
®table вместо этого тип данных. См. MATLAB table для получения дополнительной информации.
summary(A)
s = summary(A)
summary(A) выводит на печать сводку массива наборов данных и содержащихся в нем переменных.
s = summary(A) возвращает скалярную структуру s который содержит сводку набора данных A и переменные, которые A содержит. Для получения дополнительной информации о полях в s, см. Выходные данные.
Сводная информация зависит от типа переменных в наборе данных:
Для числовых переменных: summary вычисляет пятичисловую сводку данных, давая минимум, первый квартиль, медиану, третий квартиль и максимум.
Для логических переменных: summary подсчитывает количество trues и falses в данных.
Для категориальных переменных summary подсчитывает количество данных на каждом уровне.
Следующий список описывает поля в структуре s:
Description - символьный массив, содержащий описание набора данных.
Variables - Структурный массив с одним элементом для каждой переменной набора данных в A. Каждый элемент имеет следующие поля:
Name - вектор символов, содержащий имя переменной.
Description - символьный вектор, содержащий описание переменной.
Units - символьный вектор, содержащий единицы измерения переменной.
Size - числовой вектор, содержащий размер переменной.
Class - символьный вектор, содержащий класс переменной.
Data - скалярная структура, содержащая следующие поля.
Для числовых переменных:
Probabilities - Числовой вектор, содержащий вероятности [0,0 ,25 ,50 ,75 1,0] и NaN (если таковые присутствуют в соответствующей переменной набора данных).
Quantiles - числовой вектор, содержащий значения, которые соответствуют «вероятностям» для соответствующей переменной набора данных, и число NaNs (если таковые имеются).
Для логических переменных:
Values - логический вектор [true false].
Counts - числовой вектор счетчиков для каждого логического значения.
Для категориальных переменных:
Levels - массив ячеек, содержащий метки для каждого уровня соответствующей переменной набора данных.
Counts - числовой вектор счетчиков для каждого уровня.
'Data' пуст, если переменная не является числовой, категориальной или логической. Если переменная набора данных имеет более одного столбца, то соответствующий столбец 'Quantiles' или 'Counts' поле является матрицей или массивом.
Обобщите данные радужки Фишера:
load fisheriris
species = nominal(species);
data = dataset(species,meas);
summary(data)
species: [150x1 nominal]
setosa versicolor virginica
50 50 50
meas: [150x4 double]
min 4.3000 2 1 0.1000
1st Q 5.1000 2.8000 1.6000 0.3000
median 5.8000 3 4.3500 1.3000
3rd Q 6.4000 3.3000 5.1000 1.8000
max 7.9000 4.4000 6.9000 2.5000Суммирование данных в hospital.mat:
load hospital
summary(hospital)
Dataset array created from the data file hospital.dat.
The first column of the file ("id") is used for observation
names. Other columns ("sex" and "smoke") have been
converted from their original coded values into categorical
and logical variables. Two sets of columns ("sys" and
"dia", "trial1" through "trial4") have been combined into
single variables with multivariate observations. Column
headers have been replaced with more descriptive variable
names. Units have been added where appropriate.
LastName: [100x1 cell array of character vectors]
Sex: [100x1 nominal]
Female Male
53 47
Age: [100x1 double, Units = Yrs]
min 1st Q median 3rd Q max
25 32 39 44 50
Weight: [100x1 double, Units = Lbs]
min 1st Q median 3rd Q max
111 130.5000 142.5000 180.5000 202
Smoker: [100x1 logical]
true false
34 66
BloodPressure: [100x2 double, Units = mm Hg]
Systolic/Diastolic
min 109 68
1st Q 117.5000 77.5000
median 122 81.5000
3rd Q 127.5000 89
max 138 99
Trials: [100x1 cell, Units = Counts]
From zero to four measurement trials performed