summary

Печать сводных данных по таблице, расписанию или категориальному массиву

Описание

пример

summary(T) печатает сводные данные таблицы или расписания T.

  • Если T является таблицей, затем в сводной таблице отображается описание из T.Properties.Description далее приводятся сводные данные табличных переменных.

  • Если T является расписанием, затем в сводных данных расписаний отображается описание из T.Properties.Description, сводные данные времени строк, а затем сводные данные переменных расписания.

пример

s = summary(T) возвращает структуру, s, который содержит сводные данные таблицы входа или расписания. Каждое поле s сам по себе является структурой, которая суммирует значения в соответствующей переменной T. Если T является расписанием, тогда s также имеет поле, которое суммирует время строки T.

пример

summary(A) печатает сводные данные категориального массива A.

  • Если A является вектором, тогда summary(A) отображает имена категорий вместе с количеством элементов в каждой категории (счетчики категорий). В нем также отображается количество неопределенных элементов.

  • Если A является матрицей, тогда summary обрабатывает столбцы A как векторы и отображает счетчики категорий для каждого столбца A.

  • Если A является многомерным массивом, затем summary действует вдоль первого измерения массива, размер которого не равен 1.

пример

summary(A,dim) печатает счетчики категорий категориального массива A вдоль размерной dim.

Например, счетчики каждой строки можно отобразить в категориальном массиве с помощью summary(A,2).

Примеры

свернуть все

Составьте таблицу.

load patients
BloodPressure = [Systolic Diastolic];
T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName);

Добавьте описания и модулей измерения в таблицу T. Вы можете добавить описание для таблицы в целом, а также для отдельных переменных.

T.Properties.Description = 'Simulated patient data';
T.Properties.VariableUnits =  {''  'Yrs' ''  'mm Hg'};
T.Properties.VariableDescriptions{4} = 'Systolic/Diastolic';

Печать сводных данных табличных T.

format compact

summary(T)
Description:  Simulated patient data
Variables:
    Gender: 100x1 cell array of character vectors
    Age: 100x1 double
        Properties:
            Units:  Yrs
        Values:
            Min          25   
            Median       39   
            Max          50   
    Smoker: 100x1 logical
        Values:
            True        34   
            False       66   
    BloodPressure: 100x2 double
        Properties:
            Units:  mm Hg
            Description:  Systolic/Diastolic
        Values:
                      Column 1    Column 2
                      ________    ________
            Min         109           68  
            Median      122         81.5  
            Max         138           99  

summary отображает минимальное, медианное и максимальное значения для каждого столбца переменной BloodPressure.

Создайте небольшое расписание.

Time = [seconds(1:5)]';
TT = timetable(Time,[98;97.5;97.9;98.1;97.9],[120;111;119;117;116],...
               'VariableNames',{'Reading1','Reading2'})
TT=5×2 timetable
    Time     Reading1    Reading2
    _____    ________    ________

    1 sec        98        120   
    2 sec      97.5        111   
    3 sec      97.9        119   
    4 sec      98.1        117   
    5 sec      97.9        116   

Распечатайте сводные данные расписания. summary выводит на печать сводные данные времени строки и сводных данных переменных. Если расписание является регулярным, то summary также печатает размер временного шага между временами строк.

summary(TT)
RowTimes:

    Time: 5x1 duration
        Values:
            Min           1 sec 
            Median        3 sec 
            Max           5 sec 
            TimeStep      1 sec 

Variables:

    Reading1: 5x1 double

        Values:

            Min         97.5  
            Median      97.9  
            Max         98.1  

    Reading2: 5x1 double

        Values:

            Min         111   
            Median      117   
            Max         120   

Составьте таблицу. Добавьте модулей измерения к табличным переменным. Затем отобразите первые несколько строк.

load patients
BloodPressure = [Systolic Diastolic];
T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName);
T.Properties.VariableUnits =  {''  'Years' ''  'mm Hg'};
head(T,3)
ans=3×4 table
                  Gender      Age    Smoker    BloodPressure
                __________    ___    ______    _____________

    Smith       {'Male'  }    38     true       124     93  
    Johnson     {'Male'  }    43     false      109     77  
    Williams    {'Female'}    38     false      125     83  

Верните сводные данные таблицы. Чтобы вернуть сводные данные как структуру, задайте выходной аргумент при использовании summary функция.

s = summary(T)
s = struct with fields:
           Gender: [1x1 struct]
              Age: [1x1 struct]
           Smoker: [1x1 struct]
    BloodPressure: [1x1 struct]

Отобразите сводные данные табличной переменной Age. Для каждой переменной Tвыходной аргумент s имеет поле, которое содержит его сводные данные.

s.Age
ans = struct with fields:
           Size: [100 1]
           Type: 'double'
    Description: ''
          Units: 'Years'
     Continuity: []
            Min: 25
         Median: 39
            Max: 50
     NumMissing: 0

The NumMissing в поле показано количество элементов, которые являются отсутствующим значением. В этом случае Age не содержит никаких NaN значений, так NumMissing равен нулю. summary включает в себя NumMissing поле для числа, duration, datetime, и categorical переменные.

Отобразите минимальный возраст, содержащийся в таблице. Вы можете получить доступ к любому полю сводных данных по имени.

s.Age.Min
ans = 25

Отобразите сводные данные табличной переменной Smoker. Вы можете определить количество курильщиков и некурящих из True и False поля. Информация, содержащаяся в сводных данных табличной переменной, зависит от типа данных переменной.

s.Smoker
ans = struct with fields:
           Size: [100 1]
           Type: 'logical'
    Description: ''
          Units: ''
     Continuity: []
           True: 34
          False: 66

Составьте расписание.

Time = datetime({'2015-12-18 08:00:00';'2015-12-18 10:00:00';'2015-12-18 12:00:00'});
Temp = [37.3;39.1;42.3];
Pressure = [30.1;30.03;29.9];
TT = timetable(Time,Temp,Pressure)
TT=3×2 timetable
            Time            Temp    Pressure
    ____________________    ____    ________

    18-Dec-2015 08:00:00    37.3      30.1  
    18-Dec-2015 10:00:00    39.1     30.03  
    18-Dec-2015 12:00:00    42.3      29.9  

Возвращает сводные данные расписания как структуры.

s = summary(TT)
s = struct with fields:
        Time: [1x1 struct]
        Temp: [1x1 struct]
    Pressure: [1x1 struct]

Отображение сводных данных по временам строк. The TimeStep поле показывает, что временной интервал между последовательными временами строк составляет два часа. The NumMissing показаны отсутствующие значения (NaT) в векторе времени строки.

s.Time
ans = struct with fields:
          Size: [3 1]
          Type: 'datetime'
           Min: 18-Dec-2015 08:00:00
        Median: 18-Dec-2015 10:00:00
           Max: 18-Dec-2015 12:00:00
    NumMissing: 0
      TimeStep: 02:00:00

Измените время последней строки так, чтобы время строки имело различные интервалы между ними.

TT.Time(3) = '2015-12-18 11:00:00';
TT
TT=3×2 timetable
            Time            Temp    Pressure
    ____________________    ____    ________

    18-Dec-2015 08:00:00    37.3      30.1  
    18-Dec-2015 10:00:00    39.1     30.03  
    18-Dec-2015 11:00:00    42.3      29.9  

Возвращает сводные данные обновленного расписания. Поскольку временные шаги между временами строк различны, TimeStep поле имеет NaN.

s = summary(TT);
s.Time
ans = struct with fields:
          Size: [3 1]
          Type: 'datetime'
           Min: 18-Dec-2015 08:00:00
        Median: 18-Dec-2015 10:00:00
           Max: 18-Dec-2015 11:00:00
    NumMissing: 0
      TimeStep: NaN

Начиная с R2018b, вы можете добавить пользовательские свойства к таблицам и расписаниям. Если вы добавляете пользовательские свойства, сводные данные таблицы или расписания включает эти свойства.

Сначала создайте таблицу и добавьте значения к некоторым ее предопределенным свойствам.

load patients
BloodPressure = [Systolic Diastolic];
T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName);
T.Properties.Description = 'Simulated patient data';
T.Properties.VariableUnits =  {''  'Yrs' ''  'mm Hg'};
T.Properties.VariableDescriptions{4} = 'Systolic/Diastolic';

Добавьте пользовательские свойства с помощью addprop функция. Для каждого пользовательского свойства задайте имя. Кроме того, укажите, сохраняет ли значение каждого пользовательского свойства метаданные, которые применяются к таблице или отдельным табличным переменным.

T = addprop(T,{'SourceFile','DataOrigin'},{'table','variable'});

Сохраните значения метаданных в пользовательских свойствах.

T.Properties.CustomProperties.SourceFile = 'patients.mat';
T.Properties.CustomProperties.DataOrigin = {'census','census','self report','blood pressure reading'};

Печать сводных данных по таблице. Помимо T.Properties.Description, а summary функция не отображает свойства, применяемые к таблице в целом. Таким образом, он не отображает значение T.Properties.CustomProperties.SourceFile. Однако summary отображает свойства, которые применяются к табличным переменным. Для каждой переменной, summary отображает соответствующее значение из T.Properties.CustomProperties.DataOrigin.

summary(T)
Description:  Simulated patient data

Variables:

    Gender: 100x1 cell array of character vectors

        Custom Properties:
            DataOrigin:  census
    Age: 100x1 double

        Properties:
            Units:  Yrs
        Custom Properties:
            DataOrigin:  census
        Values:

            Min          25   
            Median       39   
            Max          50   

    Smoker: 100x1 logical

        Custom Properties:
            DataOrigin:  self report
        Values:

            True        34   
            False       66   

    BloodPressure: 100x2 double

        Properties:
            Units:  mm Hg
            Description:  Systolic/Diastolic
        Custom Properties:
            DataOrigin:  blood pressure reading
        Values:
                      Column 1    Column 2
                      ________    ________

            Min         109           68  
            Median      122         81.5  
            Max         138           99  

Возвращает сводные данные как структуру. Каждое поле имеет структуру, соответствующую одной из табличных переменных.

s = summary(T)
s = struct with fields:
           Gender: [1x1 struct]
              Age: [1x1 struct]
           Smoker: [1x1 struct]
    BloodPressure: [1x1 struct]

Структура s.Age сохраняет сводные данные для Age переменная.

s.Age
ans = struct with fields:
                Size: [100 1]
                Type: 'double'
         Description: ''
               Units: 'Yrs'
          Continuity: []
                 Min: 25
              Median: 39
                 Max: 50
          NumMissing: 0
    CustomProperties: [1x1 struct]

The s.Age.CustomProperties структура сохраняет соответствующее значение из T.Properties.CustomProperties.DataOrigin свойство.

s.Age.CustomProperties
ans = struct with fields:
    DataOrigin: {'census'}

Создайте категориальный вектор 1 на 5.

A = categorical({'plane' 'car' 'train' 'car' 'plane'})
A = 1x5 categorical
     plane      car      train      car      plane 

A имеет три категории, car, plane, и train.

Печать сводных данных по A.

summary(A)
     car      plane      train 
     2        2          1     

car появляется в двух элементах A, plane появляется в двух элементах, и train появляется в одном элементе.

Начиная с A является вектор-строка, summary В перечислены вхождения каждой категории по горизонтали.

Создайте категориальный массив 4 на 2, A, из числового массива.

X = [1 3; 2 1; 3 1; 4 2];
valueset = 1:3;
catnames = {'red','green','blue'};

A = categorical(X,valueset,catnames)
A = 4x2 categorical
     red              blue  
     green            red   
     blue             red   
     <undefined>      green 

A имеет три категории, red, green, и blue. Значение, 4, не был включен в valueset вход в categorical функция. Поэтому соответствующий элемент, A(4,1), не имеет соответствующей категории и не определен.

Печать сводных данных по A.

summary(A)
     red              1      2 
     green            1      1 
     blue             1      1 
     <undefined>      1      0 

red появляется один раз в первом столбце A и дважды во втором столбце.

green появляется один раз в первом столбце A и один раз во втором столбце.

blue появляется один раз в первом столбце A и один раз во втором столбце.

A содержит только один неопределенный элемент. Это происходит в первом столбце.

Создайте категориальный массив 3 на 2, A, из числового массива.

A = categorical([1 3; 2 1; 3 1],1:3,{'red','green','blue'})
A = 3x2 categorical
     red        blue 
     green      red  
     blue       red  

A имеет три категории, red, green, и blue.

Печать сводных данных по A вдоль второго измерения.

summary(A,2)
     red      green      blue 
     1        0          1    
     1        1          0    
     1        0          1    

red появляется один раз в первой строке A, один раз во второй строке, и один раз в третьей строке.

green появляется только в одном элементе. Это происходит во второй строке A.

blue появляется один раз в первой строке A и один раз в третьей строке.

Входные параметры

свернуть все

Входная таблица, заданная как таблица или расписание.

Категориальный массив, заданный как векторный, матричный или многомерный массив.

Размерность A для работы с, заданным как положительный целочисленный скаляр. Если значение не задано, по умолчанию это первое измерение массива, не равный 1.

Рассмотрим двумерный категориальный массив A:

Если dim = 1, затем summary(A,dim) отображает счетчики категорий для каждого столбца A.

Если dim = 2, затем summary(A,dim) возвращает счетчики категорий для каждой строки A.

Если dim больше ndims(A), затем summary(A) возвращает массив того же размера, что и A для каждой категории. summary возвращает 1 для элементов соответствующей категории и 0 в противном случае.

Выходные аргументы

свернуть все

Сводные данные переменных таблицы или расписания, возвращенная в виде скалярной структуры. Для каждой переменной T. VarName в вход T, а структура output s содержит поле s. VarName с сводными данными для этой переменной.

Если T имеет переменные с недопустимыми именами MATLAB® идентификаторы, затем summary изменяет их для создания допустимых имен полей, в основном путем удаления пространств и замены символов, отличных от ASCII, на символы подчеркивания.

Для каждого типа данных, с. VarName содержит поля, показанные ниже. Вы можете получить доступ к полям с индексацией точек. Например, с. VarName.Size возвращает размер табличной переменной с именем VarName.

Тип таблицы или переменной Timetable

Поля для сводных данных переменных

Описание

Число, datetime, или duration

Size

Размер переменной, сохраненный в виде числового массива

Type

Тип переменной, сохраненный в виде вектора символов

Description

Описание переменной, сохраненное в виде вектора символов

Units

Модули измерения переменной, сохраненные в виде вектора символов

Min

Минимальное значение

Median

Медианное значение

Max

Максимальное значение

NumMissing

Количество отсутствующих значений (NaN или NaT)

CustomProperties (опускается, если нет пользовательских свойств)

Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура

логичный

Size

Размер переменной, сохраненный в виде числового массива

Type

Тип переменной, сохраненный в виде вектора символов

Description

Описание переменной, сохраненное в виде вектора символов

Units

Модули измерения переменной, сохраненные в виде вектора символов

True

Количество true значения

False

Количество false значения

CustomProperties (опускается, если нет пользовательских свойств)

Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура

categorical

Size

Размер переменной, сохраненный в виде числового массива

Type

Тип переменной, сохраненный в виде вектора символов

Description

Описание переменной, сохраненное в виде вектора символов

Units

Модули измерения переменной, сохраненные в виде вектора символов

Categories

Категории, сохраненные как массив ячеек из векторов символов

Counts

Количество элементов в каждой категории, сохраненных в виде числового массива

NumMissing

Количество отсутствующих значений (<undefined>)

CustomProperties (опускается, если нет пользовательских свойств)

Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура

Другое

Size

Размер переменной, сохраненный в виде числового массива

Type

Тип переменной, сохраненный в виде вектора символов

Description

Описание переменной, сохраненное в виде вектора символов

Units

Модули измерения переменной, сохраненные в виде вектора символов

CustomProperties (опускается, если нет пользовательских свойств)

Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура

Если T является расписанием, тогда s также имеет поле с сводными данными по временам строк. Только для времени строки расписания, сводные данные включает в себя TimeStep поле. Если время строки увеличивается или уменьшается монотонно на фиксированный временной шаг, то TimeStep имеет числовое значение. Если значения времени строк нерегулярны, то TimeStep является NaN.

Поля для сводных данных времени строк Timetable

Описание полей

Size

Размер вектора времени строки, сохраненный как числовой массив

Type

Тип данных, сохраненный как вектор символов

Min

Минимальное значение

Median

Медианное значение

Max

Максимальное значение

NumMissing

Количество отсутствующих значений (NaT или NaN)

TimeStep

Временной шаг между последовательными временами строк (NaN если нерегулярно)

Подробнее о

свернуть все

Сводная таблица

В сводной таблице отображается описание таблицы из T.Properties.Description за которым следует информация о переменных T.

Сводные данные содержат следующую информацию о переменных:

  • Имя: Размер и тип данных - Имя переменной от T.Properties.VariableNames, размер переменной и тип данных переменной.

  • Модули - Переменные модули измерения от T.Properties.VariableUnits.

  • Описание - Описание переменной из T.Properties.VariableDescriptions.

  • Пользовательские свойства: - имена пользовательских свойств, которые применяются к переменным, и их соответствующие значения из T.Properties.CustomProperties. Если пользовательских свойств нет, этот раздел опускается.

  • Значения - включены только для числа, логического, categorical, datetime, или duration переменные.

    • Число, datetime, или duration переменные - минимальные, медианные и максимальные значения. Кроме того, количество отсутствующих значений (NaNs или NaTs) включается, когда это число больше нуля.

    • Логические переменные - количество значений, которые true и количество значений, которые false.

    • categorical переменные - количество элементов из каждой категории. Кроме того, количество неопределенных элементов включается, когда это количество больше нуля.

Если T является расписанием, тогда сводные данные содержат ту же информацию о векторе времени строки.

Расширенные возможности

Введенный в R2013b