Чтение данных массива ДНК отображения Affymetrix из файла аннотации CSV-формата
AnnotStruct
= affysnpannotread(File
, PID
)
AnnotStruct
= affysnpannotread(File
, PID
,
'LookUpField', LookUpFieldValue
)
File | Вектор символов или строка, задающая имя файла или путь и имя файла Affymetrix® Файл аннотации CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или набора массивов Mapping 500K. Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке. |
PID | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов в массиве отображения Affymetrix. |
LookUpFieldValue | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в следующей таблице. |
AnnotStruct | Структура MATLAB, содержащая информацию для одного или нескольких наборов зондов из
|
читает AnnotStruct
= affysnpannotread(File
, PID
)File
, файл аннотации Affymetrix CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или Mapping 500K и возвращает AnnotStruct
, структуру MATLAB, содержащую информацию аннотации для одного или нескольких наборов зондов, заданных PID
, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов. AnnotStruct
содержит подмножество полей в File
. Поля описаны в следующей таблице.
Структура, созданная из файла аннотации Affymetrix CSV
Область | Описание |
---|---|
ProbeSetIDs | Массив ячеек, содержащий уникальные идентификаторы набора зондов, заданные |
Chromosome | Массив ячеек, содержащий номер хромосомы, на котором расположен каждый набор зондов. |
ChromPosition | Массив ячеек, содержащий геномное положение SNP на хромосоме для каждого набора зондов. |
Cytoband | Массив ячеек, содержащая цитогенетическую полосообразующую область хромосомы, на которой расположен каждый набор зондов. |
Sequence | Массив ячеек, содержащий последовательность каждого набора зондов. |
AlleleA | Массив ячеек, содержащий основу, которое является аллелем A для каждого набора зондов. |
AlleleB | Массив ячеек, содержащий основу, которое является аллелем B для каждого набора зондов. |
Accession | Массив ячеек, содержащий GenBank® номер доступа для каждого набора зондов. |
FragmentLength | Массив ячеек, содержащий длину каждого набора зондов. |
возвращает информацию аннотации только из поля (столбца), заданного AnnotStruct
= affysnpannotread(File
, PID
,
'LookUpField', LookUpFieldValue
)LookUpFieldValue
, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в предыдущей таблице.
Примечание
Можно загрузить файлы аннотации Affymetrix CSV, такие как Mapping50K_Xba240.na25.annot.csv
от:
Следующий пример предполагает, что у вас есть Mapping50K_Xba240.CDF
файл, хранящийся в C:\AffyLibFiles\
, и что ваша текущая папка указывает на расположение, содержащее Mapping50K_Xba240.na25.annot.csv
файл аннотации.
Используйте affyread
функция для создания структуры, содержащей информацию из Mapping50K_Xba240.CDF
файл библиотеки.
cdf = affyread('C:\AffyLibFiles\Mapping50K_Xba240.CDF');
Создайте переменную, содержащую массив ячеек из имен наборов зондов, которые хранятся в Name
поле ProbeSets
поле cdf
структура.
probesetIDs = {cdf.ProbeSets.Name}';
Возвращает структуру, содержащую информацию о аннотации для всех наборов зондов в Mapping50K_Xba240.na25.annot.csv
файл аннотации.
snpInfo = affysnpannotread('Mapping50K_Xba240.na25.annot.csv',probesetIDs) snpInfo = ProbeSetIDs: {59024x1 cell} Chromosome: [59024x1 int8] ChromPosition: [59024x1 double] Cytoband: {59024x1 cell} Sequence: {59024x1 cell} AlleleA: {59024x1 cell} AlleleB: {59024x1 cell} Accession: {59024x1 cell} FragmentLength: [59024x1 double]