(Не Рекомендуемый) Массивы для статистических данных
The dataset
тип данных не рекомендуется. Для работы с неоднородными данными используйте MATLAB®
table
вместо этого тип данных. См. MATLAB table
документация для получения дополнительной информации.
Массивы набора данных используются для сбора гетерогенных данных и метаданных, включая имена переменных и наблюдений, в одну переменную контейнера. Массивы набора данных подходят для хранения ориентированных на столбцы или табличных данных, которые часто хранятся в виде столбцов в текстовом файле или в электронной таблице, и могут включать переменные различных типов, размеров, модулей измерения и т.д.
Массивы набора данных могут содержать различные типы переменных, включая числовые, логические, символьные, строковые, категориальные и камеры. Однако массив набора данных является другим классом, чем переменные, которые он содержит. Например, даже массив набора данных, который содержит только переменные, которые являются двойными массивами, не может эксплуатироваться, как если бы он сам был двойным массивом. Однако, используя индексирование через точку, можно работать с переменной в массиве набора данных, как если бы это была переменная рабочей области.
Можно подстрочить массивы набора данных с помощью круглых скобок во многом как обычные числовые массивы, но в дополнение к числовым и логическим индексам можно использовать в качестве индексов имена переменных и наблюдений.
Используйте dataset
конструктор, чтобы создать массив набора данных из переменных в рабочем пространстве MATLAB. Можно также создать массив набора данных путем чтения данных из текста или файла электронной таблицы. Вы можете получить доступ к каждой переменной в массиве набора данных, очень похожем на поля в структуре, с помощью индексирования на точку. Список операций, доступных для массивов наборов данных, см. в следующем разделе.
набор данных | (Не Рекомендуемый) Создать массив набора данных |
кошка | (Не Рекомендуемый) Сцепить массивы набора данных |
cellstr | (Не Рекомендуемый) Создать массив ячеек из векторов символов из массива набора данных |
dataset2cell | (Не Рекомендуемый) Преобразовать массив набора данных в массив ячеек |
dataset2struct | (Не Рекомендуемый) Преобразовать массив набора данных в структуру |
datasetfun | (Не Рекомендуемый) Применить функцию к переменным массива набора данных |
disp | (Не Рекомендуемый) Отобразить массив набора данных |
отображение | (Не Рекомендуемый) Отобразить массив набора данных |
дважды | (Не Рекомендуемый) Преобразовать переменные набора данных в двойной массив |
конец | (Не Рекомендуемый) Последний индекс в выражении индексации для массива набора данных |
экспорт | (Не Рекомендуемый) Записать массив набора данных в файл |
добраться | (Не Рекомендуемый) Доступ к свойствам массива набора данных |
horzcat | (Не Рекомендуемый) Горизонтальная конкатенация для массивов набора данных |
пересечься | (Не Рекомендуемый) Задать пересечение для наблюдений массива набора данных |
isempty | (Не Рекомендуемый) True для пустого массива набора данных |
ismember | (Не Рекомендуемый) Элементы массива набора данных, которые являются представителями набора |
ismissing | (Не Рекомендуемый) Найти элементы массива набора данных с отсутствующими значениями |
соединение | (Не Рекомендуемый) Объединить наблюдения массива набора данных |
длина | (Не Рекомендуемый) Длина массива набора данных |
ndims | (Не Рекомендуемый) Количество размерностей массива набора данных |
numel | (Не Рекомендуемый) Количество элементов в массиве набора данных |
replaceWithMissing | (Не Рекомендуемый) Вставить индикаторы недостающих данных в массив набора данных |
replacedata | (Не Рекомендуемый) Заменить переменные набора данных |
набор | (Не Рекомендуемый) Задать и отображение свойства массива набора данных |
setdiff | (Не Рекомендуемый) Задать различие для наблюдений массива набора данных |
setxor | (Не Рекомендуемый) Задать исключающее или для наблюдений массива набора данных |
одинок | (Не Рекомендуемый) Преобразовать переменные набора данных в один массив |
размер | (Не Рекомендуемый) Размер массива набора данных |
sortrows | (Не Рекомендуемый) Сортировка строк массива набора данных |
стек | (Не Рекомендуемый) Стек массив набора данных из нескольких переменных в одну переменную |
subsasgn | (Не Рекомендуемый) Подписанное назначение массиву набора данных |
subsref | (Не Рекомендуемый) Подписанная ссылка для массива набора данных |
сводные данные | (Не Рекомендуемый) Печать сводных данных по массиву набора данных |
объединение | (Не Рекомендуемый) Задать объединение для наблюдений за массивом набора данных |
уникальный | (Не Рекомендуемый) Уникальные наблюдения в массиве набора данных |
нестек | (Не Рекомендуемый) Удалить стек массива набора данных из одной переменной в несколько переменных |
vertcat | (Не Рекомендуемый) Вертикальная конкатенация для массивов набора данных |
Массив набора данных D
имеет свойства, которые хранят метаданные (информацию о ваших данных). Доступ или присвоение свойству с помощью P = D.Properties.PropName
или D.Properties.PropName = P
, где PropName
является одним из следующих:
|
|
|
Двухэлементный массив ячеек из векторов символов, задающий имена двух размерностей массива набора данных. Значение по умолчанию является |
|
Массив ячеек из непустых, отдельных векторов символов, дающий имена наблюдений в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству наблюдений. |
|
Массив ячеек из векторов символов, задающий модули измерения переменных в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству переменных. Любой отдельный вектор символов может быть пустым для переменной, которая не имеет заданных модулей. По умолчанию это пустой массив ячеек. |
|
Любая переменная, содержащая дополнительную информацию, которая будет связана с массивом набора данных. По умолчанию это пустой массив. |
|
Массив ячеек из векторов символов, дающий описание переменных в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству переменных. Любой отдельный вектор символов может быть пустым для переменной, которая не имеет заданного описания. По умолчанию это пустой массив ячеек. |
|
Массив ячеек из непустых отдельных векторов символов с именами переменных в массиве набора данных. Количество векторов символов должно равняться количеству переменных. По умолчанию это массив ячеек с именами для переменных, используемых для создания набора данных. |
Значение. Чтобы узнать, как это влияет на использование класса, смотрите Сравнение указателя и классов значений в документации по объектно-ориентированному программированию MATLAB.
Загрузите массив набора данных из .mat файла и создайте несколько простых подмножеств:
load hospital h1 = hospital(1:10,:) h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'}) % Access and modify metadata hospital.Properties.Description hospital.Properties.VarNames{4} = 'Wgt' % Create a new dataset variable from an existing one hospital.AtRisk = hospital.Smoker | (hospital.Age > 40) % Use individual variables to explore the data boxplot(hospital.Age,hospital.Sex) h3 = hospital(hospital.Age<30,... {'LastName' 'Age' 'Sex' 'Smoker'}) % Sort the observations based on two variables h4 = sortrows(hospital,{'Sex','Age'})