Тулбокс включает функции, объекты и методы для создания, хранения и доступа к данным микромассивов.
Функция конструктора объектов, DataMatrix, позволяет вам создать объект DataMatrix, чтобы инкапсулировать данные и метаданные (имена строк и столбцов) из микромассива эксперимента. Объект DataMatrix хранит экспериментальные данные в матрице с строками, обычно соответствующими именам генов или идентификаторам зондов, и столбцами, обычно соответствующими идентификаторам выборок. Объект DataMatrix также хранит метаданные, включая имена генов или идентификаторы зондов (в качестве имен строк) и идентификаторы образцов (в качестве имен столбцов).
Можно ссылаться на значения выражения микромассивов в объекте DataMatrix так же, как и на данные в MATLAB® массив, то есть при помощи линейной или логической индексации. Кроме того, вы можете ссылаться на эти экспериментальные данные по генным (зондовым) идентификаторам и идентификаторам образцов. Индексация этими идентификаторами позволяет вам быстро и удобно получить доступ к подмножествам данных, не имея необходимости поддерживать дополнительные массивы индексов.
Многие операторы MATLAB и арифметические функции доступны объектам DataMatrix с помощью методов. Эти методы позволяют вам изменять, объединять, сравнивать, анализировать, отображать и получать доступ к информации от объектов DataMatrix. Кроме того, вы можете легко расширить функциональность с помощью общих элементарных функций, dmarrayfun и dmbsxfunи путем ручного доступа к свойствам объекта DataMatrix.
Примечание
Для таблиц, описывающих свойства и методы объекта DataMatrix, смотрите страницу с описанием объекта DataMatrix.
Загрузите MAT-файл, поставляемый с программным обеспечением Bioinformatics Toolbox™, которое содержит данные о дрожжах. Этот MAT-файл включает три переменные: yeastvalues, матрица 614 на 7 данных экспрессии генов, genes, массив ячеек 614 GenBank® номера доступа для маркировки строк в yeastvalues, и timesвектор 1 на 7 значений времени для маркировки столбцов в yeastvalues.
load filteredyeastdata
Создайте переменные, которые будут содержать подмножество данных, в частности первые пять строк и первые четыре столбца yeastvalues матрица, genes массив ячеек и times вектор.
yeastvalues = yeastvalues(1:5,1:4); genes = genes(1:5,:); times = times(1:4);
Импортируйте пакет объектов микромассивов так, чтобы DataMatrix функция конструктора будет доступна.
import bioma.data.*
Используйте DataMatrix функция конструктора для создания небольшого объекта DataMatrix из данных экспрессии генов.
dmo = DataMatrix(yeastvalues,genes,times)
dmo =
0 9.5 11.5 13.5
SS DNA -0.131 1.699 -0.026 0.365
YAL003W 0.305 0.146 -0.129 -0.444
YAL012W 0.157 0.175 0.467 -0.379
YAL026C 0.246 0.796 0.384 0.981
YAL034C -0.235 0.487 -0.184 -0.669Вы используете get и set методы для извлечения и задания свойств объекта DataMatrix.
Используйте get метод отображения свойств объекта DataMatrix, dmo.
get(dmo)
Name: ''
RowNames: {5x1 cell}
ColNames: {' 0' ' 9.5' '11.5' '13.5'}
NRows: 5
NCols: 4
NDims: 2
ElementClass: 'double'Используйте set метод задания имени для объекта DataMatrix, dmo.
dmo = set(dmo,'Name','MyDMObject');
Используйте get снова метод для отображения свойств объекта DataMatrix, dmo.
get(dmo)
Name: 'MyDMObject'
RowNames: {5x1 cell}
ColNames: {' 0' ' 9.5' '11.5' '13.5'}
NRows: 5
NCols: 4
NDims: 2
ElementClass: 'double'Примечание
Описание всех свойств объекта DataMatrix смотрите на странице с описанием объекта DataMatrix.
Объекты DataMatrix поддерживают следующие типы индексации для извлечения, назначения и удаления данных:
Круглая скобка ()
Точка. индексация
Используйте индексацию круглых скобок, чтобы извлечь подмножество данных в dmo и присвойте его новому объекту DataMatrix dmo2:
dmo2 = dmo(1:5,2:3)
dmo2 =
9.5 11.5
SS DNA 1.699 -0.026
YAL003W 0.146 -0.129
YAL012W 0.175 0.467
YAL026C 0.796 0.384
YAL034C 0.487 -0.184Используйте индексацию круглых скобок, чтобы извлечь подмножество данных с помощью имен строк и столбцов и назначить его новому объекту DataMatrix dmo3:
dmo3 = dmo({'SS DNA','YAL012W','YAL034C'},'11.5')
dmo3 =
11.5
SS DNA -0.026
YAL012W 0.467
YAL034C -0.184Примечание
Если для индекса в объект DataMatrix используется массив ячеек с именами строк или имен столбцов, имена должны быть уникальными, даже если имена строк или столбцов в объекте DataMatrix не уникальны.
Используйте индексацию круглых скобок, чтобы назначить новые данные подмножеству элементов в dmo2:
dmo2({'SS DNA', 'YAL003W'}, 1:2) = [1.700 -0.030; 0.150 -0.130]
dmo2 =
9.5 11.5
SS DNA 1.7 -0.03
YAL003W 0.15 -0.13
YAL012W 0.175 0.467
YAL026C 0.796 0.384
YAL034C 0.487 -0.184Используйте индексацию круглых скобок, чтобы удалить подмножество данных в dmo2:
dmo2({'SS DNA', 'YAL003W'}, :) = []
dmo2 =
9.5 11.5
YAL012W 0.175 0.467
YAL026C 0.796 0.384
YAL034C 0.487 -0.184Примечание
В следующих примерах заметьте, что при использовании индексации точек с объектами DataMatrix вы задаете все строки или все столбцы, используя двоеточие в пределах одинарных кавычек (':').
Используйте индексацию точек, чтобы извлечь данные из 11.5 только столбец dmo:
timeValues = dmo.(':')('11.5')
timeValues =
-0.0260
-0.1290
0.4670
0.3840
-0.1840Используйте индексацию точек, чтобы назначить новые данные подмножеству элементов в dmo:
dmo.(1:2)(':') = 7
dmo =
0 9.5 11.5 13.5
SS DNA 7 7 7 7
YAL003W 7 7 7 7
YAL012W 0.157 0.175 0.467 -0.379
YAL026C 0.246 0.796 0.384 0.981
YAL034C -0.235 0.487 -0.184 -0.669Используйте индексацию точек, чтобы удалить целую переменную из dmo:
dmo.YAL034C = []
dmo =
0 9.5 11.5 13.5
SS DNA 7 7 7 7
YAL003W 7 7 7 7
YAL012W 0.157 0.175 0.467 -0.379
YAL026C 0.246 0.796 0.384 0.981Используйте индексацию точек, чтобы удалить два столбца из dmo:
dmo.(':')(2:3)=[]
dmo =
0 13.5
SS DNA 7 7
YAL003W 7 7
YAL012W 0.157 -0.379
YAL026C 0.246 0.981