dataset class

(Не Рекомендуемый) Массивы для статистических данных

The dataset тип данных не рекомендуется. Для работы с неоднородными данными используйте MATLAB® table вместо этого тип данных. См. MATLAB table документация для получения дополнительной информации.

Описание

Массивы набора данных используются для сбора гетерогенных данных и метаданных, включая имена переменных и наблюдений, в одну переменную контейнера. Массивы набора данных подходят для хранения ориентированных на столбцы или табличных данных, которые часто хранятся в виде столбцов в текстовом файле или в электронной таблице, и могут включать переменные различных типов, размеров, модулей измерения и т.д.

Массивы набора данных могут содержать различные типы переменных, включая числовые, логические, символьные, строковые, категориальные и камеры. Однако массив набора данных является другим классом, чем переменные, которые он содержит. Например, даже массив набора данных, который содержит только переменные, которые являются двойными массивами, не может эксплуатироваться, как если бы он сам был двойным массивом. Однако, используя индексирование через точку, можно работать с переменной в массиве набора данных, как если бы это была переменная рабочей области.

Можно подстрочить массивы набора данных с помощью круглых скобок во многом как обычные числовые массивы, но в дополнение к числовым и логическим индексам можно использовать в качестве индексов имена переменных и наблюдений.

Конструкция

Используйте dataset конструктор, чтобы создать массив набора данных из переменных в рабочем пространстве MATLAB. Можно также создать массив набора данных путем чтения данных из текста или файла электронной таблицы. Вы можете получить доступ к каждой переменной в массиве набора данных, очень похожем на поля в структуре, с помощью индексирования на точку. Список операций, доступных для массивов наборов данных, см. в следующем разделе.

набор данных(Не Рекомендуемый) Создать массив набора данных

Методы

кошка(Не Рекомендуемый) Сцепить массивы набора данных
cellstr(Не Рекомендуемый) Создать массив ячеек из векторов символов из массива набора данных
dataset2cell(Не Рекомендуемый) Преобразовать массив набора данных в массив ячеек
dataset2struct(Не Рекомендуемый) Преобразовать массив набора данных в структуру
datasetfun(Не Рекомендуемый) Применить функцию к переменным массива набора данных
disp(Не Рекомендуемый) Отобразить массив набора данных
отображение(Не Рекомендуемый) Отобразить массив набора данных
дважды(Не Рекомендуемый) Преобразовать переменные набора данных в двойной массив
конец(Не Рекомендуемый) Последний индекс в выражении индексации для массива набора данных
экспорт(Не Рекомендуемый) Записать массив набора данных в файл
добраться(Не Рекомендуемый) Доступ к свойствам массива набора данных
horzcat(Не Рекомендуемый) Горизонтальная конкатенация для массивов набора данных
пересечься(Не Рекомендуемый) Задать пересечение для наблюдений массива набора данных
isempty(Не Рекомендуемый) True для пустого массива набора данных
ismember(Не Рекомендуемый) Элементы массива набора данных, которые являются представителями набора
ismissing(Не Рекомендуемый) Найти элементы массива набора данных с отсутствующими значениями
соединение(Не Рекомендуемый) Объединить наблюдения массива набора данных
длина(Не Рекомендуемый) Длина массива набора данных
ndims(Не Рекомендуемый) Количество размерностей массива набора данных
numel(Не Рекомендуемый) Количество элементов в массиве набора данных
replaceWithMissing(Не Рекомендуемый) Вставить индикаторы недостающих данных в массив набора данных
replacedata(Не Рекомендуемый) Заменить переменные набора данных
набор(Не Рекомендуемый) Задать и отображение свойства массива набора данных
setdiff(Не Рекомендуемый) Задать различие для наблюдений массива набора данных
setxor(Не Рекомендуемый) Задать исключающее или для наблюдений массива набора данных
одинок(Не Рекомендуемый) Преобразовать переменные набора данных в один массив
размер(Не Рекомендуемый) Размер массива набора данных
sortrows(Не Рекомендуемый) Сортировка строк массива набора данных
стек(Не Рекомендуемый) Стек массив набора данных из нескольких переменных в одну переменную
subsasgn(Не Рекомендуемый) Подписанное назначение массиву набора данных
subsref(Не Рекомендуемый) Подписанная ссылка для массива набора данных
сводные данные(Не Рекомендуемый) Печать сводных данных по массиву набора данных
объединение(Не Рекомендуемый) Задать объединение для наблюдений за массивом набора данных
уникальный(Не Рекомендуемый) Уникальные наблюдения в массиве набора данных
нестек(Не Рекомендуемый) Удалить стек массива набора данных из одной переменной в несколько переменных
vertcat(Не Рекомендуемый) Вертикальная конкатенация для массивов набора данных

Свойства

Массив набора данных D имеет свойства, которые хранят метаданные (информацию о ваших данных). Доступ или присвоение свойству с помощью P = D.Properties.PropName или D.Properties.PropName = P, где PropName является одним из следующих:

Description

Description является вектором символов, описывающим массив набора данных. По умолчанию это пустой символьный вектор.

DimNames

Двухэлементный массив ячеек из векторов символов, задающий имена двух размерностей массива набора данных. Значение по умолчанию является {'Observations' 'Variables'}.

ObsNames

Массив ячеек из непустых, отдельных векторов символов, дающий имена наблюдений в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству наблюдений.

Units

Массив ячеек из векторов символов, задающий модули измерения переменных в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству переменных. Любой отдельный вектор символов может быть пустым для переменной, которая не имеет заданных модулей. По умолчанию это пустой массив ячеек.

UserData

Любая переменная, содержащая дополнительную информацию, которая будет связана с массивом набора данных. По умолчанию это пустой массив.

VarDescription

Массив ячеек из векторов символов, дающий описание переменных в массиве набора данных. Это свойство может быть пустым, но если не пустым, количество векторов символов должно равняться количеству переменных. Любой отдельный вектор символов может быть пустым для переменной, которая не имеет заданного описания. По умолчанию это пустой массив ячеек.

VarNames

Массив ячеек из непустых отдельных векторов символов с именами переменных в массиве набора данных. Количество векторов символов должно равняться количеству переменных. По умолчанию это массив ячеек с именами для переменных, используемых для создания набора данных.

Копировать семантику

Значение. Чтобы узнать, как это влияет на использование класса, смотрите Сравнение указателя и классов значений в документации по объектно-ориентированному программированию MATLAB.

Примеры

Загрузите массив набора данных из .mat файла и создайте несколько простых подмножеств:

load hospital
h1 = hospital(1:10,:)
h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'})

% Access and modify metadata
hospital.Properties.Description
hospital.Properties.VarNames{4} = 'Wgt'

% Create a new dataset variable from an existing one
hospital.AtRisk = hospital.Smoker | (hospital.Age > 40)

% Use individual variables to explore the data
boxplot(hospital.Age,hospital.Sex)
h3 = hospital(hospital.Age<30,...
   {'LastName' 'Age' 'Sex' 'Smoker'})

% Sort the observations based on two variables
h4 = sortrows(hospital,{'Sex','Age'})