affysnpannotread

Чтение данных массива ДНК отображения Affymetrix из файла аннотации CSV-формата

Синтаксис

AnnotStruct = affysnpannotread(File, PID)
AnnotStruct = affysnpannotread(File, PID, 'LookUpField', LookUpFieldValue)

Входные параметры

File

Вектор символов или строка, задающая имя файла или путь и имя файла Affymetrix® Файл аннотации CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или набора массивов Mapping 500K.

Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке.

PID

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов в массиве отображения Affymetrix.

LookUpFieldValueВектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в следующей таблице.

Выходные аргументы

AnnotStruct

Структура MATLAB, содержащая информацию для одного или нескольких наборов зондов из File, файл аннотации Affymetrix CSV.

AnnotStruct содержит подмножество полей в File. Поля описаны в таблице ниже.

Описание

AnnotStruct = affysnpannotread(File, PID) читает File, файл аннотации Affymetrix CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или Mapping 500K и возвращает AnnotStruct, структуру MATLAB, содержащую информацию аннотации для одного или нескольких наборов зондов, заданных PID, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов. AnnotStruct содержит подмножество полей в File. Поля описаны в следующей таблице.

Структура, созданная из файла аннотации Affymetrix CSV

ОбластьОписание
ProbeSetIDs

Массив ячеек, содержащий уникальные идентификаторы набора зондов, заданные PID вход.

Chromosome

Массив ячеек, содержащий номер хромосомы, на котором расположен каждый набор зондов.

ChromPosition

Массив ячеек, содержащий геномное положение SNP на хромосоме для каждого набора зондов.

Cytoband

Массив ячеек, содержащая цитогенетическую полосообразующую область хромосомы, на которой расположен каждый набор зондов.

Sequence

Массив ячеек, содержащий последовательность каждого набора зондов.

AlleleA

Массив ячеек, содержащий основу, которое является аллелем A для каждого набора зондов.

AlleleB

Массив ячеек, содержащий основу, которое является аллелем B для каждого набора зондов.

Accession

Массив ячеек, содержащий GenBank® номер доступа для каждого набора зондов.

FragmentLength

Массив ячеек, содержащий длину каждого набора зондов.

AnnotStruct = affysnpannotread(File, PID, 'LookUpField', LookUpFieldValue) возвращает информацию аннотации только из поля (столбца), заданного LookUpFieldValue, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в предыдущей таблице.

Примечание

Можно загрузить файлы аннотации Affymetrix CSV, такие как Mapping50K_Xba240.na25.annot.csv от:

Примеры

Следующий пример предполагает, что у вас есть Mapping50K_Xba240.CDF файл, хранящийся в C:\AffyLibFiles\, и что ваша текущая папка указывает на расположение, содержащее Mapping50K_Xba240.na25.annot.csv файл аннотации.

  1. Используйте affyread функция для создания структуры, содержащей информацию из Mapping50K_Xba240.CDF файл библиотеки.

    cdf = affyread('C:\AffyLibFiles\Mapping50K_Xba240.CDF');
    
  2. Создайте переменную, содержащую массив ячеек из имен наборов зондов, которые хранятся в Name поле ProbeSets поле cdf структура.

    probesetIDs = {cdf.ProbeSets.Name}';
    
  3. Возвращает структуру, содержащую информацию о аннотации для всех наборов зондов в Mapping50K_Xba240.na25.annot.csv файл аннотации.

    snpInfo = affysnpannotread('Mapping50K_Xba240.na25.annot.csv',probesetIDs)
    
    snpInfo = 
    
           ProbeSetIDs: {59024x1 cell}
            Chromosome: [59024x1 int8]
         ChromPosition: [59024x1 double]
              Cytoband: {59024x1 cell}
              Sequence: {59024x1 cell}
               AlleleA: {59024x1 cell}
               AlleleB: {59024x1 cell}
             Accession: {59024x1 cell}
        FragmentLength: [59024x1 double]
    
Введенный в R2008b