сводные данные

Класс: набор данных

Распечатайте сводные данные массива набора данных

Тип данных dataset может быть удален в будущем релизе. Чтобы работать с гетерогенными данными, используйте тип данных MATLAB® table вместо этого. Смотрите MATLAB документация table для получения дополнительной информации.

Синтаксис

summary(A)
s = summary(A)

Описание

summary(A) распечатывает сводные данные массива набора данных и переменных, которые это содержит.

s = summary(A) возвращает скалярную структуру s, который содержит сводные данные набора данных A и переменных, которые содержит A. Для получения дополнительной информации о полях в s смотрите Выходные параметры.

Итоговая информация зависит от типа переменных в наборе данных:

  • Для числовых переменных summary вычисляет сводные данные с пятью номерами данных, давая минимум, первый квартиль, медиану, третий квартиль и максимум.

  • Для логических переменных summary считает количество true s и false s в данных.

  • Для категориальных переменных summary считает количество данных на каждом уровне.

Выходные аргументы

Следующий список описывает поля в структуре s:

  • Описание Символьный массив, содержащий описание набора данных.

  • Переменные Массив структур с одним элементом для каждой переменной набора данных в A. Каждый элемент имеет следующие поля:

    • Имя Вектор символов, содержащий имя переменной.

    • Описание Вектор символов, содержащий описание переменной.

    • Модули Вектор символов, содержащий модули переменной.

    • Размер Числовой вектор, содержащий размер переменной.

    • Класс Вектор символов, содержащий класс переменной.

    • Данные Скалярная структура, содержащая следующие поля.

      Для числовых переменных:

      • Probabilities — Числовой вектор, содержащий вероятности [0.0.25.50.75 1.0] и NaN (если кто-либо присутствует в соответствующей переменной набора данных).

      • Quantiles — Числовой вектор, содержащий значения, которые соответствуют 'Вероятностям' для соответствующей переменной набора данных и количеству NaNs (если кто-либо присутствует).

      Для логических переменных:

      • Значения Логический вектор [истинная ложь].

      • Counts — Числовой вектор счетов для каждого логического значения.

      Для категориальных переменных:

      • Levels — Массив ячеек, содержащий метки для каждого уровня соответствующей переменной набора данных.

      • Counts — Числовой вектор счетов для каждого уровня.

      'Data' пуст, если переменная не является числовой, категориальной, или логической. Если переменная набора данных имеет больше чем один столбец, то соответствующее поле 'Quantiles' или 'Counts' является матрицей или массивом.

Примеры

Обобщите ирисовые данные Фишера:

load fisheriris
species = nominal(species);
data = dataset(species,meas);
summary(data)
species: [150x1 nominal]
  setosa   versicolor   virginica
      50           50          50
meas: [150x4 double]
  min       4.3000         2         1    0.1000 
  1st Q     5.1000    2.8000    1.6000    0.3000 
  median    5.8000         3    4.3500    1.3000 
  3rd Q     6.4000    3.3000    5.1000    1.8000 
  max       7.9000    4.4000    6.9000    2.5000

Обобщите данные в hospital.mat:

load hospital
summary(hospital)

Dataset array created from the data file hospital.dat.

The first column of the file ("id") is used for observation
names.  Other columns ("sex" and "smoke") have been 
converted from their original coded values into categorical
and logical variables.  Two sets of columns ("sys" and 
"dia", "trial1" through "trial4") have been combined into 
single variables with multivariate observations.  Column 
headers have been replaced with more descriptive variable 
names.  Units have been added where appropriate.


LastName: [100x1 cell array of character vectors]
Sex: [100x1 nominal]
     Female      Male 
         53        47 

Age: [100x1 double, Units = Yrs]
     min      1st Q      median      3rd Q      max
      25         32          39         44       50

Weight: [100x1 double, Units = Lbs]
     min      1st Q         median        3rd Q        max
     111      130.5000      142.5000      180.5000     202

Smoker: [100x1 logical]
     true      false 
       34         66 

BloodPressure: [100x2 double, Units = mm Hg]
Systolic/Diastolic
     min              109           68 
     1st Q       117.5000      77.5000 
     median           122      81.5000 
     3rd Q       127.5000           89 
     max              138           99 

Trials: [100x1 cell, Units = Counts]
From zero to four measurement trials performed

Смотрите также

| |