Представление значений данных выражения в объектах DataMatrix

Обзор объектов DataMatrix

Тулбокс включает функции, объекты и методы для создания, хранения и доступа к данным микромассивов.

Функция конструктора объектов, DataMatrix, позволяет вам создать объект DataMatrix, чтобы инкапсулировать данные и метаданные (имена строк и столбцов) из микромассива эксперимента. Объект DataMatrix хранит экспериментальные данные в матрице с строками, обычно соответствующими именам генов или идентификаторам зондов, и столбцами, обычно соответствующими идентификаторам выборок. Объект DataMatrix также хранит метаданные, включая имена генов или идентификаторы зондов (в качестве имен строк) и идентификаторы образцов (в качестве имен столбцов).

Можно ссылаться на значения выражения микромассивов в объекте DataMatrix так же, как и на данные в MATLAB® массив, то есть при помощи линейной или логической индексации. Кроме того, вы можете ссылаться на эти экспериментальные данные по генным (зондовым) идентификаторам и идентификаторам образцов. Индексация этими идентификаторами позволяет вам быстро и удобно получить доступ к подмножествам данных, не имея необходимости поддерживать дополнительные массивы индексов.

Многие операторы MATLAB и арифметические функции доступны объектам DataMatrix с помощью методов. Эти методы позволяют вам изменять, объединять, сравнивать, анализировать, отображать и получать доступ к информации от объектов DataMatrix. Кроме того, вы можете легко расширить функциональность с помощью общих элементарных функций, dmarrayfun и dmbsxfunи путем ручного доступа к свойствам объекта DataMatrix.

Примечание

Для таблиц, описывающих свойства и методы объекта DataMatrix, смотрите страницу с описанием объекта DataMatrix.

Построение объектов DataMatrix

  1. Загрузите MAT-файл, поставляемый с программным обеспечением Bioinformatics Toolbox™, которое содержит данные о дрожжах. Этот MAT-файл включает три переменные: yeastvalues, матрица 614 на 7 данных экспрессии генов, genes, массив ячеек 614 GenBank® номера доступа для маркировки строк в yeastvalues, и timesвектор 1 на 7 значений времени для маркировки столбцов в yeastvalues.

    load filteredyeastdata
    
  2. Создайте переменные, которые будут содержать подмножество данных, в частности первые пять строк и первые четыре столбца yeastvalues матрица, genes массив ячеек и times вектор.

    yeastvalues = yeastvalues(1:5,1:4);
    genes = genes(1:5,:);
    times = times(1:4);
  3. Импортируйте пакет объектов микромассивов так, чтобы DataMatrix функция конструктора будет доступна.

    import bioma.data.*
    
  4. Используйте DataMatrix функция конструктора для создания небольшого объекта DataMatrix из данных экспрессии генов.

    dmo = DataMatrix(yeastvalues,genes,times)
    
    dmo = 
    
                      0       9.5     11.5      13.5  
        SS DNA     -0.131    1.699    -0.026     0.365
        YAL003W     0.305    0.146    -0.129    -0.444
        YAL012W     0.157    0.175     0.467    -0.379
        YAL026C     0.246    0.796     0.384     0.981
        YAL034C    -0.235    0.487    -0.184    -0.669

Получение и настройка свойств объекта DataMatrix

Вы используете get и set методы для извлечения и задания свойств объекта DataMatrix.

  1. Используйте get метод отображения свойств объекта DataMatrix, dmo.

    get(dmo)
                Name: ''
            RowNames: {5x1 cell}
            ColNames: {'   0'  ' 9.5'  '11.5'  '13.5'}
               NRows: 5
               NCols: 4
               NDims: 2
        ElementClass: 'double'
  2. Используйте set метод задания имени для объекта DataMatrix, dmo.

    dmo = set(dmo,'Name','MyDMObject');
  3. Используйте get снова метод для отображения свойств объекта DataMatrix, dmo.

    get(dmo)
                Name: 'MyDMObject'
            RowNames: {5x1 cell}
            ColNames: {'   0'  ' 9.5'  '11.5'  '13.5'}
               NRows: 5
               NCols: 4
               NDims: 2
        ElementClass: 'double'

Примечание

Описание всех свойств объекта DataMatrix смотрите на странице с описанием объекта DataMatrix.

Доступ к данным в объектах DataMatrix

Объекты DataMatrix поддерживают следующие типы индексации для извлечения, назначения и удаления данных:

  • Круглая скобка ()

  • Точка. индексация

Индексация круглых скобок ()

Используйте индексацию круглых скобок, чтобы извлечь подмножество данных в dmo и присвойте его новому объекту DataMatrix dmo2:

dmo2 = dmo(1:5,2:3)
dmo2 = 
                9.5     11.5  
    SS DNA     1.699    -0.026
    YAL003W    0.146    -0.129
    YAL012W    0.175     0.467
    YAL026C    0.796     0.384
    YAL034C    0.487    -0.184

Используйте индексацию круглых скобок, чтобы извлечь подмножество данных с помощью имен строк и столбцов и назначить его новому объекту DataMatrix dmo3:

dmo3 = dmo({'SS DNA','YAL012W','YAL034C'},'11.5')

dmo3 = 

               11.5  
    SS DNA     -0.026
    YAL012W     0.467
    YAL034C    -0.184

Примечание

Если для индекса в объект DataMatrix используется массив ячеек с именами строк или имен столбцов, имена должны быть уникальными, даже если имена строк или столбцов в объекте DataMatrix не уникальны.

Используйте индексацию круглых скобок, чтобы назначить новые данные подмножеству элементов в dmo2:

dmo2({'SS DNA', 'YAL003W'}, 1:2) = [1.700 -0.030; 0.150 -0.130]
dmo2 = 

                9.5     11.5  
    SS DNA       1.7     -0.03
    YAL003W     0.15     -0.13
    YAL012W    0.175     0.467
    YAL026C    0.796     0.384
    YAL034C    0.487    -0.184

Используйте индексацию круглых скобок, чтобы удалить подмножество данных в dmo2:

dmo2({'SS DNA', 'YAL003W'}, :) = []
dmo2 = 

                9.5     11.5  
    YAL012W    0.175     0.467
    YAL026C    0.796     0.384
    YAL034C    0.487    -0.184

Точка. Индексация

Примечание

В следующих примерах заметьте, что при использовании индексации точек с объектами DataMatrix вы задаете все строки или все столбцы, используя двоеточие в пределах одинарных кавычек (':').

Используйте индексацию точек, чтобы извлечь данные из 11.5 только столбец dmo:

timeValues = dmo.(':')('11.5')
timeValues =

   -0.0260
   -0.1290
    0.4670
    0.3840
   -0.1840

Используйте индексацию точек, чтобы назначить новые данные подмножеству элементов в dmo:

dmo.(1:2)(':') = 7
dmo = 

                  0       9.5     11.5      13.5  
    SS DNA          7        7         7         7
    YAL003W         7        7         7         7
    YAL012W     0.157    0.175     0.467    -0.379
    YAL026C     0.246    0.796     0.384     0.981
    YAL034C    -0.235    0.487    -0.184    -0.669

Используйте индексацию точек, чтобы удалить целую переменную из dmo:

dmo.YAL034C = []
dmo = 

                  0      9.5     11.5     13.5  
    SS DNA         7        7        7         7
    YAL003W        7        7        7         7
    YAL012W    0.157    0.175    0.467    -0.379
    YAL026C    0.246    0.796    0.384     0.981

Используйте индексацию точек, чтобы удалить два столбца из dmo:

dmo.(':')(2:3)=[] 

dmo = 

                  0     13.5  
    SS DNA         7         7
    YAL003W        7         7
    YAL012W    0.157    -0.379
    YAL026C    0.246     0.981