Суперклассы:
Массивы для статистических данных
Тип данных dataset
может быть удален в будущем релизе. Чтобы работать с гетерогенными данными, используйте тип данных MATLAB® table
вместо этого. Смотрите MATLAB документация table
для получения дополнительной информации.
Массивы набора данных используются, чтобы собрать гетерогенные данные и метаданные включая переменную и имена наблюдения в одну контейнерную переменную. Массивы набора данных подходят для того, чтобы хранить ориентированный на столбец или табличные данные, которые часто хранимы как столбцы в текстовом файле или в электронной таблице и могут разместить переменные различных типов, размеров, модулей, и т.д.
Массивы набора данных могут содержать различные виды переменных, включая числовой, логическое, символ, строку, категориальную, и ячейка. Однако массив набора данных является различным классом, чем переменные, которые он содержит. Например, даже массив набора данных, который содержит только переменные, которые удваивают массивы, не может управляться, как будто это был самостоятельно двойной массив. Однако с помощью точечного индексирования, можно работать с переменной в массиве набора данных, как будто это была переменная рабочей области.
Можно преобразовать массивы набора данных в нижний индекс с помощью круглых скобок во многом как обычные числовые массивы, но в дополнение к числовым и логическим индексам, можно использовать переменную и имена наблюдения как индексы.
Используйте конструктора dataset
, чтобы создать массив набора данных из переменных в рабочем пространстве MATLAB. Можно также создать массив набора данных путем чтения данных из текста или файла электронной таблицы. Можно получить доступ к каждой переменной в массиве набора данных во многом как поля в структуре, с помощью точечного индексирования. Смотрите следующий раздел для списка операций, доступных для массивов набора данных.
набор данных | Создайте массив набора данных |
\cat | Массивы набора данных Concatenate |
cellstr | Создайте массив ячеек из символьных векторов из массива набора данных |
dataset2cell | Преобразуйте массив набора данных в массив ячеек |
dataset2struct | Преобразуйте массив набора данных в структуру |
datasetfun | Примените функцию к переменным типа массив набора данных |
disp | Отобразите массив набора данных |
отображение | Отобразите массив набора данных |
'double' | Преобразуйте переменные набора данных в двойной массив |
конец | В последний раз индексируйте в индексации выражения для массива набора данных |
экспорт | Запишите массив набора данных в файл |
получение | Свойства массива набора данных Access |
horzcat | Горизонтальная конкатенация для массивов набора данных |
пересечение | Установите пересечение для наблюдений набора данных массивов |
isempty | Верный для пустого массива набора данных |
ismember | Элементы массива набора данных, которые являются членами набора |
ismissing | Найдите элементы массива набора данных с отсутствующими значениями |
соединение | Объедините наблюдения |
длина | Длина массива набора данных |
ndims | Количество размерностей массива набора данных |
numel | Число элементов в массиве набора данных |
replaceWithMissing | Вставьте индикаторы недостающих данных в массив набора данных |
replacedata | Замените переменные набора данных |
набор | Установите и отобразите свойства |
setdiff | Разность множеств для наблюдений набора данных массивов |
setxor | Установите исключительный или для наблюдений набора данных массивов |
единственный | Преобразуйте переменные набора данных в единый массив |
размер | Размер массива набора данных |
sortrows | Сортировка строк массива набора данных |
стек | Сложите данные из нескольких переменных в одну переменную |
subsasgn | Преобразованное в нижний индекс присвоение на массив набора данных |
subsref | Преобразованная в нижний индекс ссылка для массива набора данных |
сводные данные | Распечатайте сводные данные массива набора данных |
объединение | Установите объединение для наблюдений набора данных массивов |
уникальный | Уникальные наблюдения в массиве набора данных |
нестек | Распакуйте данные из одной переменной в несколько переменных |
vertcat | Вертикальная конкатенация для массивов набора данных |
D
набора данных массивов имеет свойства, которые хранят метаданные (информация о ваших данных). Доступ или присвоение к свойству с помощью P = D.Properties.PropName
или D.Properties.PropName = P
, где PropName
является одним из следующего:
Описание | Вектор символов, описывающий набор данных |
DimNames | Двухэлементные имена дающего массива ячеек из символьных векторов размерностей набора данных |
ObsNames | Массив ячеек непустых, отличных векторов символов, дающих имена наблюдений в наборе данных |
Модули | Модули переменных в наборе данных |
UserData | Переменный содержащий дополнительную информацию сопоставлен с набором данных |
VarDescription | Массив ячеек из символьных векторов, дающий описания переменных в наборе данных |
Varnames | Имена дающего массива ячеек переменных в наборе данных |
Значение. Чтобы изучить, как это влияет на ваше использование класса, смотрите Сравнение Указателя и Классов Значения (MATLAB) в документации Объектно-ориентированного программирования MATLAB.
Загрузите массив набора данных из .mat файла и создайте некоторые простые подмножества:
load hospital h1 = hospital(1:10,:) h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'}) % Access and modify metadata hospital.Properties.Description hospital.Properties.VarNames{4} = 'Wgt' % Create a new dataset variable from an existing one hospital.AtRisk = hospital.Smoker | (hospital.Age > 40) % Use individual variables to explore the data boxplot(hospital.Age,hospital.Sex) h3 = hospital(hospital.Age<30,... {'LastName' 'Age' 'Sex' 'Smoker'}) % Sort the observations based on two variables h4 = sortrows(hospital,{'Sex','Age'})