Тулбокс включает функции, объекты и методы для создания, хранения и доступа к данным микромассивов.
Функция конструктора объектов, DataMatrix
, позволяет вам создать объект DataMatrix, чтобы инкапсулировать данные и метаданные (имена строк и столбцов) из микромассива эксперимента. Объект DataMatrix хранит экспериментальные данные в матрице с строками, обычно соответствующими именам генов или идентификаторам зондов, и столбцами, обычно соответствующими идентификаторам выборок. Объект DataMatrix также хранит метаданные, включая имена генов или идентификаторы зондов (в качестве имен строк) и идентификаторы образцов (в качестве имен столбцов).
Можно ссылаться на значения выражения микромассивов в объекте DataMatrix так же, как и на данные в MATLAB® массив, то есть при помощи линейной или логической индексации. Кроме того, вы можете ссылаться на эти экспериментальные данные по генным (зондовым) идентификаторам и идентификаторам образцов. Индексация этими идентификаторами позволяет вам быстро и удобно получить доступ к подмножествам данных, не имея необходимости поддерживать дополнительные массивы индексов.
Многие операторы MATLAB и арифметические функции доступны объектам DataMatrix с помощью методов. Эти методы позволяют вам изменять, объединять, сравнивать, анализировать, отображать и получать доступ к информации от объектов DataMatrix. Кроме того, вы можете легко расширить функциональность с помощью общих элементарных функций, dmarrayfun
и dmbsxfun
и путем ручного доступа к свойствам объекта DataMatrix.
Примечание
Для таблиц, описывающих свойства и методы объекта DataMatrix, смотрите страницу с описанием объекта DataMatrix.
Загрузите MAT-файл, поставляемый с программным обеспечением Bioinformatics Toolbox™, которое содержит данные о дрожжах. Этот MAT-файл включает три переменные: yeastvalues
, матрица 614 на 7 данных экспрессии генов, genes
, массив ячеек 614 GenBank® номера доступа для маркировки строк в yeastvalues
, и times
вектор 1 на 7 значений времени для маркировки столбцов в yeastvalues
.
load filteredyeastdata
Создайте переменные, которые будут содержать подмножество данных, в частности первые пять строк и первые четыре столбца yeastvalues
матрица, genes
массив ячеек и times
вектор.
yeastvalues = yeastvalues(1:5,1:4); genes = genes(1:5,:); times = times(1:4);
Импортируйте пакет объектов микромассивов так, чтобы DataMatrix
функция конструктора будет доступна.
import bioma.data.*
Используйте DataMatrix
функция конструктора для создания небольшого объекта DataMatrix из данных экспрессии генов.
dmo = DataMatrix(yeastvalues,genes,times) dmo = 0 9.5 11.5 13.5 SS DNA -0.131 1.699 -0.026 0.365 YAL003W 0.305 0.146 -0.129 -0.444 YAL012W 0.157 0.175 0.467 -0.379 YAL026C 0.246 0.796 0.384 0.981 YAL034C -0.235 0.487 -0.184 -0.669
Вы используете get
и set
методы для извлечения и задания свойств объекта DataMatrix.
Используйте get
метод отображения свойств объекта DataMatrix, dmo
.
get(dmo) Name: '' RowNames: {5x1 cell} ColNames: {' 0' ' 9.5' '11.5' '13.5'} NRows: 5 NCols: 4 NDims: 2 ElementClass: 'double'
Используйте set
метод задания имени для объекта DataMatrix, dmo
.
dmo = set(dmo,'Name','MyDMObject');
Используйте get
снова метод для отображения свойств объекта DataMatrix, dmo
.
get(dmo) Name: 'MyDMObject' RowNames: {5x1 cell} ColNames: {' 0' ' 9.5' '11.5' '13.5'} NRows: 5 NCols: 4 NDims: 2 ElementClass: 'double'
Примечание
Описание всех свойств объекта DataMatrix смотрите на странице с описанием объекта DataMatrix.
Объекты DataMatrix поддерживают следующие типы индексации для извлечения, назначения и удаления данных:
Круглая скобка ()
Точка. индексация
Используйте индексацию круглых скобок, чтобы извлечь подмножество данных в dmo
и присвойте его новому объекту DataMatrix dmo2
:
dmo2 = dmo(1:5,2:3) dmo2 = 9.5 11.5 SS DNA 1.699 -0.026 YAL003W 0.146 -0.129 YAL012W 0.175 0.467 YAL026C 0.796 0.384 YAL034C 0.487 -0.184
Используйте индексацию круглых скобок, чтобы извлечь подмножество данных с помощью имен строк и столбцов и назначить его новому объекту DataMatrix dmo3
:
dmo3 = dmo({'SS DNA','YAL012W','YAL034C'},'11.5') dmo3 = 11.5 SS DNA -0.026 YAL012W 0.467 YAL034C -0.184
Примечание
Если для индекса в объект DataMatrix используется массив ячеек с именами строк или имен столбцов, имена должны быть уникальными, даже если имена строк или столбцов в объекте DataMatrix не уникальны.
Используйте индексацию круглых скобок, чтобы назначить новые данные подмножеству элементов в dmo2
:
dmo2({'SS DNA', 'YAL003W'}, 1:2) = [1.700 -0.030; 0.150 -0.130] dmo2 = 9.5 11.5 SS DNA 1.7 -0.03 YAL003W 0.15 -0.13 YAL012W 0.175 0.467 YAL026C 0.796 0.384 YAL034C 0.487 -0.184
Используйте индексацию круглых скобок, чтобы удалить подмножество данных в dmo2
:
dmo2({'SS DNA', 'YAL003W'}, :) = [] dmo2 = 9.5 11.5 YAL012W 0.175 0.467 YAL026C 0.796 0.384 YAL034C 0.487 -0.184
Примечание
В следующих примерах заметьте, что при использовании индексации точек с объектами DataMatrix вы задаете все строки или все столбцы, используя двоеточие в пределах одинарных кавычек (':')
.
Используйте индексацию точек, чтобы извлечь данные из 11.5
только столбец dmo
:
timeValues = dmo.(':')('11.5') timeValues = -0.0260 -0.1290 0.4670 0.3840 -0.1840
Используйте индексацию точек, чтобы назначить новые данные подмножеству элементов в dmo
:
dmo.(1:2)(':') = 7 dmo = 0 9.5 11.5 13.5 SS DNA 7 7 7 7 YAL003W 7 7 7 7 YAL012W 0.157 0.175 0.467 -0.379 YAL026C 0.246 0.796 0.384 0.981 YAL034C -0.235 0.487 -0.184 -0.669
Используйте индексацию точек, чтобы удалить целую переменную из dmo
:
dmo.YAL034C = [] dmo = 0 9.5 11.5 13.5 SS DNA 7 7 7 7 YAL003W 7 7 7 7 YAL012W 0.157 0.175 0.467 -0.379 YAL026C 0.246 0.796 0.384 0.981
Используйте индексацию точек, чтобы удалить два столбца из dmo
:
dmo.(':')(2:3)=[] dmo = 0 13.5 SS DNA 7 7 YAL003W 7 7 YAL012W 0.157 -0.379 YAL026C 0.246 0.981