Печать сводных данных по таблице, расписанию или категориальному массиву
summary(
печатает сводные данные таблицы или расписания T
)T
.
Если T
является таблицей, затем в сводной таблице отображается описание из T.Properties.Description
далее приводятся сводные данные табличных переменных.
Если T
является расписанием, затем в сводных данных расписаний отображается описание из T.Properties.Description
, сводные данные времени строк, а затем сводные данные переменных расписания.
summary(
печатает сводные данные категориального массива A
)A
.
Если A
является вектором, тогда summary(A)
отображает имена категорий вместе с количеством элементов в каждой категории (счетчики категорий). В нем также отображается количество неопределенных элементов.
Если A
является матрицей, тогда summary
обрабатывает столбцы A
как векторы и отображает счетчики категорий для каждого столбца A
.
Если A
является многомерным массивом, затем summary
действует вдоль первого измерения массива, размер которого не равен 1
.
Составьте таблицу.
load patients BloodPressure = [Systolic Diastolic]; T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName);
Добавьте описания и модулей измерения в таблицу T
. Вы можете добавить описание для таблицы в целом, а также для отдельных переменных.
T.Properties.Description = 'Simulated patient data'; T.Properties.VariableUnits = {'' 'Yrs' '' 'mm Hg'}; T.Properties.VariableDescriptions{4} = 'Systolic/Diastolic';
Печать сводных данных табличных T
.
format compact
summary(T)
Description: Simulated patient data Variables: Gender: 100x1 cell array of character vectors Age: 100x1 double Properties: Units: Yrs Values: Min 25 Median 39 Max 50 Smoker: 100x1 logical Values: True 34 False 66 BloodPressure: 100x2 double Properties: Units: mm Hg Description: Systolic/Diastolic Values: Column 1 Column 2 ________ ________ Min 109 68 Median 122 81.5 Max 138 99
summary
отображает минимальное, медианное и максимальное значения для каждого столбца переменной BloodPressure
.
Создайте небольшое расписание.
Time = [seconds(1:5)]'; TT = timetable(Time,[98;97.5;97.9;98.1;97.9],[120;111;119;117;116],... 'VariableNames',{'Reading1','Reading2'})
TT=5×2 timetable
Time Reading1 Reading2
_____ ________ ________
1 sec 98 120
2 sec 97.5 111
3 sec 97.9 119
4 sec 98.1 117
5 sec 97.9 116
Распечатайте сводные данные расписания. summary
выводит на печать сводные данные времени строки и сводных данных переменных. Если расписание является регулярным, то summary
также печатает размер временного шага между временами строк.
summary(TT)
RowTimes: Time: 5x1 duration Values: Min 1 sec Median 3 sec Max 5 sec TimeStep 1 sec Variables: Reading1: 5x1 double Values: Min 97.5 Median 97.9 Max 98.1 Reading2: 5x1 double Values: Min 111 Median 117 Max 120
Составьте таблицу. Добавьте модулей измерения к табличным переменным. Затем отобразите первые несколько строк.
load patients BloodPressure = [Systolic Diastolic]; T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName); T.Properties.VariableUnits = {'' 'Years' '' 'mm Hg'}; head(T,3)
ans=3×4 table
Gender Age Smoker BloodPressure
__________ ___ ______ _____________
Smith {'Male' } 38 true 124 93
Johnson {'Male' } 43 false 109 77
Williams {'Female'} 38 false 125 83
Верните сводные данные таблицы. Чтобы вернуть сводные данные как структуру, задайте выходной аргумент при использовании summary
функция.
s = summary(T)
s = struct with fields:
Gender: [1x1 struct]
Age: [1x1 struct]
Smoker: [1x1 struct]
BloodPressure: [1x1 struct]
Отобразите сводные данные табличной переменной Age
. Для каждой переменной T
выходной аргумент s
имеет поле, которое содержит его сводные данные.
s.Age
ans = struct with fields:
Size: [100 1]
Type: 'double'
Description: ''
Units: 'Years'
Continuity: []
Min: 25
Median: 39
Max: 50
NumMissing: 0
The NumMissing
в поле показано количество элементов, которые являются отсутствующим значением. В этом случае Age
не содержит никаких NaN
значений, так NumMissing
равен нулю. summary
включает в себя NumMissing
поле для числа, duration
, datetime
, и categorical
переменные.
Отобразите минимальный возраст, содержащийся в таблице. Вы можете получить доступ к любому полю сводных данных по имени.
s.Age.Min
ans = 25
Отобразите сводные данные табличной переменной Smoker
. Вы можете определить количество курильщиков и некурящих из True
и False
поля. Информация, содержащаяся в сводных данных табличной переменной, зависит от типа данных переменной.
s.Smoker
ans = struct with fields:
Size: [100 1]
Type: 'logical'
Description: ''
Units: ''
Continuity: []
True: 34
False: 66
Составьте расписание.
Time = datetime({'2015-12-18 08:00:00';'2015-12-18 10:00:00';'2015-12-18 12:00:00'}); Temp = [37.3;39.1;42.3]; Pressure = [30.1;30.03;29.9]; TT = timetable(Time,Temp,Pressure)
TT=3×2 timetable
Time Temp Pressure
____________________ ____ ________
18-Dec-2015 08:00:00 37.3 30.1
18-Dec-2015 10:00:00 39.1 30.03
18-Dec-2015 12:00:00 42.3 29.9
Возвращает сводные данные расписания как структуры.
s = summary(TT)
s = struct with fields:
Time: [1x1 struct]
Temp: [1x1 struct]
Pressure: [1x1 struct]
Отображение сводных данных по временам строк. The TimeStep
поле показывает, что временной интервал между последовательными временами строк составляет два часа. The NumMissing
показаны отсутствующие значения (NaT
) в векторе времени строки.
s.Time
ans = struct with fields:
Size: [3 1]
Type: 'datetime'
Min: 18-Dec-2015 08:00:00
Median: 18-Dec-2015 10:00:00
Max: 18-Dec-2015 12:00:00
NumMissing: 0
TimeStep: 02:00:00
Измените время последней строки так, чтобы время строки имело различные интервалы между ними.
TT.Time(3) = '2015-12-18 11:00:00';
TT
TT=3×2 timetable
Time Temp Pressure
____________________ ____ ________
18-Dec-2015 08:00:00 37.3 30.1
18-Dec-2015 10:00:00 39.1 30.03
18-Dec-2015 11:00:00 42.3 29.9
Возвращает сводные данные обновленного расписания. Поскольку временные шаги между временами строк различны, TimeStep
поле имеет NaN
.
s = summary(TT); s.Time
ans = struct with fields:
Size: [3 1]
Type: 'datetime'
Min: 18-Dec-2015 08:00:00
Median: 18-Dec-2015 10:00:00
Max: 18-Dec-2015 11:00:00
NumMissing: 0
TimeStep: NaN
Начиная с R2018b, вы можете добавить пользовательские свойства к таблицам и расписаниям. Если вы добавляете пользовательские свойства, сводные данные таблицы или расписания включает эти свойства.
Сначала создайте таблицу и добавьте значения к некоторым ее предопределенным свойствам.
load patients BloodPressure = [Systolic Diastolic]; T = table(Gender,Age,Smoker,BloodPressure,'RowNames',LastName); T.Properties.Description = 'Simulated patient data'; T.Properties.VariableUnits = {'' 'Yrs' '' 'mm Hg'}; T.Properties.VariableDescriptions{4} = 'Systolic/Diastolic';
Добавьте пользовательские свойства с помощью addprop
функция. Для каждого пользовательского свойства задайте имя. Кроме того, укажите, сохраняет ли значение каждого пользовательского свойства метаданные, которые применяются к таблице или отдельным табличным переменным.
T = addprop(T,{'SourceFile','DataOrigin'},{'table','variable'});
Сохраните значения метаданных в пользовательских свойствах.
T.Properties.CustomProperties.SourceFile = 'patients.mat'; T.Properties.CustomProperties.DataOrigin = {'census','census','self report','blood pressure reading'};
Печать сводных данных по таблице. Помимо T.Properties.Description
, а summary
функция не отображает свойства, применяемые к таблице в целом. Таким образом, он не отображает значение T.Properties.CustomProperties.SourceFile
. Однако summary
отображает свойства, которые применяются к табличным переменным. Для каждой переменной, summary
отображает соответствующее значение из T.Properties.CustomProperties.DataOrigin
.
summary(T)
Description: Simulated patient data Variables: Gender: 100x1 cell array of character vectors Custom Properties: DataOrigin: census Age: 100x1 double Properties: Units: Yrs Custom Properties: DataOrigin: census Values: Min 25 Median 39 Max 50 Smoker: 100x1 logical Custom Properties: DataOrigin: self report Values: True 34 False 66 BloodPressure: 100x2 double Properties: Units: mm Hg Description: Systolic/Diastolic Custom Properties: DataOrigin: blood pressure reading Values: Column 1 Column 2 ________ ________ Min 109 68 Median 122 81.5 Max 138 99
Возвращает сводные данные как структуру. Каждое поле имеет структуру, соответствующую одной из табличных переменных.
s = summary(T)
s = struct with fields:
Gender: [1x1 struct]
Age: [1x1 struct]
Smoker: [1x1 struct]
BloodPressure: [1x1 struct]
Структура s.Age
сохраняет сводные данные для Age
переменная.
s.Age
ans = struct with fields:
Size: [100 1]
Type: 'double'
Description: ''
Units: 'Yrs'
Continuity: []
Min: 25
Median: 39
Max: 50
NumMissing: 0
CustomProperties: [1x1 struct]
The s.Age.CustomProperties
структура сохраняет соответствующее значение из T.Properties.CustomProperties.DataOrigin
свойство.
s.Age.CustomProperties
ans = struct with fields:
DataOrigin: {'census'}
Создайте категориальный вектор 1 на 5.
A = categorical({'plane' 'car' 'train' 'car' 'plane'})
A = 1x5 categorical
plane car train car plane
A
имеет три категории, car
, plane
, и train
.
Печать сводных данных по A
.
summary(A)
car plane train 2 2 1
car
появляется в двух элементах A
, plane
появляется в двух элементах, и train
появляется в одном элементе.
Начиная с A
является вектор-строка, summary
В перечислены вхождения каждой категории по горизонтали.
Создайте категориальный массив 4 на 2, A
, из числового массива.
X = [1 3; 2 1; 3 1; 4 2]; valueset = 1:3; catnames = {'red','green','blue'}; A = categorical(X,valueset,catnames)
A = 4x2 categorical
red blue
green red
blue red
<undefined> green
A
имеет три категории, red
, green
, и blue
. Значение, 4
, не был включен в valueset
вход в categorical
функция. Поэтому соответствующий элемент, A(4,1)
, не имеет соответствующей категории и не определен.
Печать сводных данных по A
.
summary(A)
red 1 2 green 1 1 blue 1 1 <undefined> 1 0
red
появляется один раз в первом столбце A
и дважды во втором столбце.
green
появляется один раз в первом столбце A
и один раз во втором столбце.
blue
появляется один раз в первом столбце A
и один раз во втором столбце.
A
содержит только один неопределенный элемент. Это происходит в первом столбце.
Создайте категориальный массив 3 на 2, A
, из числового массива.
A = categorical([1 3; 2 1; 3 1],1:3,{'red','green','blue'})
A = 3x2 categorical
red blue
green red
blue red
A
имеет три категории, red
, green
, и blue
.
Печать сводных данных по A
вдоль второго измерения.
summary(A,2)
red green blue 1 0 1 1 1 0 1 0 1
red
появляется один раз в первой строке A
, один раз во второй строке, и один раз в третьей строке.
green
появляется только в одном элементе. Это происходит во второй строке A
.
blue
появляется один раз в первой строке A
и один раз в третьей строке.
T
- Входная таблицаВходная таблица, заданная как таблица или расписание.
A
- Категориальный массивКатегориальный массив, заданный как векторный, матричный или многомерный массив.
dim
- Размерность A
для работыРазмерность A
для работы с, заданным как положительный целочисленный скаляр. Если значение не задано, по умолчанию это первое измерение массива, не равный 1.
Рассмотрим двумерный категориальный массив A
:
Если dim = 1
, затем summary(A,dim)
отображает счетчики категорий для каждого столбца A
.
Если dim = 2
, затем summary(A,dim)
возвращает счетчики категорий для каждой строки A
.
Если dim
больше ndims(A)
, затем summary(A)
возвращает массив того же размера, что и A
для каждой категории. summary
возвращает 1
для элементов соответствующей категории и 0
в противном случае.
s
- Сводные данные переменных таблицы или расписанияСводные данные переменных таблицы или расписания, возвращенная в виде скалярной структуры. Для каждой переменной T.
в вход VarName
T
, а структура output s
содержит поле s.
с сводными данными для этой переменной.VarName
Если T
имеет переменные с недопустимыми именами MATLAB® идентификаторы, затем summary
изменяет их для создания допустимых имен полей, в основном путем удаления пространств и замены символов, отличных от ASCII, на символы подчеркивания.
Для каждого типа данных, с.
содержит поля, показанные ниже. Вы можете получить доступ к полям с индексацией точек. Например, VarName
с.
возвращает размер табличной переменной с именем VarName
.Size
.VarName
Тип таблицы или переменной Timetable | Поля для сводных данных переменных | Описание |
---|---|---|
Число, |
| Размер переменной, сохраненный в виде числового массива |
| Тип переменной, сохраненный в виде вектора символов | |
| Описание переменной, сохраненное в виде вектора символов | |
| Модули измерения переменной, сохраненные в виде вектора символов | |
| Минимальное значение | |
| Медианное значение | |
| Максимальное значение | |
| Количество отсутствующих значений ( | |
| Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура | |
логичный |
| Размер переменной, сохраненный в виде числового массива |
| Тип переменной, сохраненный в виде вектора символов | |
| Описание переменной, сохраненное в виде вектора символов | |
| Модули измерения переменной, сохраненные в виде вектора символов | |
| Количество | |
| Количество | |
| Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура | |
|
| Размер переменной, сохраненный в виде числового массива |
| Тип переменной, сохраненный в виде вектора символов | |
| Описание переменной, сохраненное в виде вектора символов | |
| Модули измерения переменной, сохраненные в виде вектора символов | |
| Категории, сохраненные как массив ячеек из векторов символов | |
| Количество элементов в каждой категории, сохраненных в виде числового массива | |
| Количество отсутствующих значений ( | |
| Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура | |
Другое |
| Размер переменной, сохраненный в виде числового массива |
| Тип переменной, сохраненный в виде вектора символов | |
| Описание переменной, сохраненное в виде вектора символов | |
| Модули измерения переменной, сохраненные в виде вектора символов | |
| Имена и значения для пользовательских свойств, сопоставленных с переменной, хранятся как структура |
Если T
является расписанием, тогда s
также имеет поле с сводными данными по временам строк. Только для времени строки расписания, сводные данные включает в себя TimeStep
поле. Если время строки увеличивается или уменьшается монотонно на фиксированный временной шаг, то TimeStep
имеет числовое значение. Если значения времени строк нерегулярны, то TimeStep
является NaN
.
Поля для сводных данных времени строк Timetable | Описание полей |
---|---|
| Размер вектора времени строки, сохраненный как числовой массив |
| Тип данных, сохраненный как вектор символов |
| Минимальное значение |
| Медианное значение |
| Максимальное значение |
| Количество отсутствующих значений ( |
| Временной шаг между последовательными временами строк ( |
В сводной таблице отображается описание таблицы из T.Properties.Description
за которым следует информация о переменных T
.
Сводные данные содержат следующую информацию о переменных:
Имя: Размер и тип данных - Имя переменной от T.Properties.VariableNames
, размер переменной и тип данных переменной.
Модули - Переменные модули измерения от T.Properties.VariableUnits
.
Описание - Описание переменной из T.Properties.VariableDescriptions
.
Пользовательские свойства: - имена пользовательских свойств, которые применяются к переменным, и их соответствующие значения из T.Properties.CustomProperties
. Если пользовательских свойств нет, этот раздел опускается.
Значения - включены только для числа, логического, categorical
, datetime
, или duration
переменные.
Число, datetime
, или duration
переменные - минимальные, медианные и максимальные значения. Кроме того, количество отсутствующих значений (NaN
s или NaT
s) включается, когда это число больше нуля.
Логические переменные - количество значений, которые true
и количество значений, которые false
.
categorical
переменные - количество элементов из каждой категории. Кроме того, количество неопределенных элементов включается, когда это количество больше нуля.
Если T
является расписанием, тогда сводные данные содержат ту же информацию о векторе времени строки.
Эта функция поддерживает длинные массивы с ограничением:
Некоторые поля в сводные данные может быть невозможно вычислить за разумное количество времени, такое как медиана.
Для получения дополнительной информации см. Раздел «Длинные массивы для данных , которых не помещаютсь в память,».
Эта функция полностью поддерживает распределенные массивы. Для получения дополнительной информации смотрите Запуск функций MATLAB с распределенными массивами (Parallel Computing Toolbox).
categorical
| categories
| countcats
| head
| table
| tail
| timetable
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.