exponenta event banner

affysnpannotread

Чтение данных массива ДНК Affymetrix Mapping из файла аннотаций формата CSV

Синтаксис

AnnotStruct = affysnpannotread(File, PID)
AnnotStruct = affysnpannotread(File, PID, 'LookUpField', LookUpFieldValue)

Входные аргументы

File

Символьный вектор или строка, указывающая имя файла или путь и имя файла файла аннотации Affymetrix ® CSV для набора массива Mapping 10K, набора массива Mapping 100K или набора массива Mapping 500K.

Если указано только имя файла, он должен находиться в пути поиска MATLAB ® или в текущей папке.

PID

Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих один или несколько идентификаторов набора зондов в массиве сопоставления Affymetrix.

LookUpFieldValueСимвольный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих один или несколько заголовков столбцов в файле аннотаций Affymetrix CSV. По умолчанию используются поля, показанные в следующей таблице.

Выходные аргументы

AnnotStruct

Структура MATLAB, содержащая информацию для одного или нескольких наборов зондов из File, файл аннотаций Affymetrix CSV.

AnnotStruct содержит подмножество полей в File. Поля описаны в таблице ниже.

Описание

AnnotStruct = affysnpannotread(File, PID) читает File, файл аннотации Affymetrix CSV для набора массива Mapping 10K, набора массива Mapping 100K или набора массива Mapping 500K и возвращает AnnotStruct, структура MATLAB, содержащая информацию аннотации для одного или нескольких наборов зондов, указанных PID, символьный вектор, строку, строковый вектор или массив ячеек символьных векторов, задающих один или несколько идентификаторов набора зондов. AnnotStruct содержит подмножество полей в File. Поля описаны в следующей таблице.

Структура, созданная из файла аннотаций Affymetrix CSV

ОбластьОписание
ProbeSetIDs

Массив ячеек, содержащий уникальные идентификаторы наборов зондов, указанные PID вход.

Chromosome

Клеточный массив, содержащий номер хромосомы, на которой расположен каждый набор зондов.

ChromPosition

Клеточный массив, содержащий геномное положение SNP на хромосоме для каждого набора зондов.

Cytoband

Клеточный массив, содержащий область цитогенетической полосы хромосомы, на которой расположен каждый набор зондов.

Sequence

Массив ячеек, содержащий последовательность каждого набора зондов.

AlleleA

Клеточный массив, содержащий основание, которое является аллелем A для каждого набора зондов.

AlleleB

Клеточный массив, содержащий основание, которое является аллелем B для каждого набора зондов.

Accession

Массив ячеек, содержащий регистрационный номер GenBank ® для каждого набора зондов.

FragmentLength

Массив ячеек, содержащий длину каждого набора зондов.

AnnotStruct = affysnpannotread(File, PID, 'LookUpField', LookUpFieldValue) возвращает информацию аннотации только из поля (столбца), указанного LookUpFieldValue, символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих один или несколько заголовков столбцов в файле аннотаций Affymetrix CSV. По умолчанию используются поля, показанные в предыдущей таблице.

Примечание

Можно загрузить файлы аннотаций Affymetrix CSV, такие как Mapping50K_Xba240.na25.annot.csv от:

Примеры

В следующем примере предполагается наличие Mapping50K_Xba240.CDF файл, хранящийся в C:\AffyLibFiles\и что текущая папка указывает на расположение, содержащее Mapping50K_Xba240.na25.annot.csv файл аннотаций.

  1. Используйте affyread для создания структуры, содержащей информацию из Mapping50K_Xba240.CDF файл библиотеки.

    cdf = affyread('C:\AffyLibFiles\Mapping50K_Xba240.CDF');
    
  2. Создайте переменную, содержащую массив ячеек имен наборов зондов, которые хранятся в Name области ProbeSets области cdf структура.

    probesetIDs = {cdf.ProbeSets.Name}';
    
  3. Возвращает структуру, содержащую информацию аннотации для всех наборов зондов в Mapping50K_Xba240.na25.annot.csv файл аннотаций.

    snpInfo = affysnpannotread('Mapping50K_Xba240.na25.annot.csv',probesetIDs)
    
    snpInfo = 
    
           ProbeSetIDs: {59024x1 cell}
            Chromosome: [59024x1 int8]
         ChromPosition: [59024x1 double]
              Cytoband: {59024x1 cell}
              Sequence: {59024x1 cell}
               AlleleA: {59024x1 cell}
               AlleleB: {59024x1 cell}
             Accession: {59024x1 cell}
        FragmentLength: [59024x1 double]
    
Представлен в R2008b