Чтение данных массива ДНК отображения Affymetrix из файла аннотации CSV-формата
AnnotStruct = affysnpannotread(File, PID)
AnnotStruct = affysnpannotread(File, PID,
'LookUpField', LookUpFieldValue)
File | Вектор символов или строка, задающая имя файла или путь и имя файла Affymetrix® Файл аннотации CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или набора массивов Mapping 500K. Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке. |
PID | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов в массиве отображения Affymetrix. |
LookUpFieldValue | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в следующей таблице. |
AnnotStruct | Структура MATLAB, содержащая информацию для одного или нескольких наборов зондов из
|
читает AnnotStruct = affysnpannotread(File, PID)File, файл аннотации Affymetrix CSV для набора массивов Mapping 10K, набора массивов Mapping 100K или Mapping 500K и возвращает AnnotStruct, структуру MATLAB, содержащую информацию аннотации для одного или нескольких наборов зондов, заданных PID, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько идентификаторов набора зондов. AnnotStruct содержит подмножество полей в File. Поля описаны в следующей таблице.
Структура, созданная из файла аннотации Affymetrix CSV
| Область | Описание |
|---|---|
ProbeSetIDs | Массив ячеек, содержащий уникальные идентификаторы набора зондов, заданные |
Chromosome | Массив ячеек, содержащий номер хромосомы, на котором расположен каждый набор зондов. |
ChromPosition | Массив ячеек, содержащий геномное положение SNP на хромосоме для каждого набора зондов. |
Cytoband | Массив ячеек, содержащая цитогенетическую полосообразующую область хромосомы, на которой расположен каждый набор зондов. |
Sequence | Массив ячеек, содержащий последовательность каждого набора зондов. |
AlleleA | Массив ячеек, содержащий основу, которое является аллелем A для каждого набора зондов. |
AlleleB | Массив ячеек, содержащий основу, которое является аллелем B для каждого набора зондов. |
Accession | Массив ячеек, содержащий GenBank® номер доступа для каждого набора зондов. |
FragmentLength | Массив ячеек, содержащий длину каждого набора зондов. |
возвращает информацию аннотации только из поля (столбца), заданного AnnotStruct = affysnpannotread(File, PID,
'LookUpField', LookUpFieldValue)LookUpFieldValue, вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько заголовков столбцов в файле аннотации Affymetrix CSV. По умолчанию это поля, показанные в предыдущей таблице.
Примечание
Можно загрузить файлы аннотации Affymetrix CSV, такие как Mapping50K_Xba240.na25.annot.csv от:
Следующий пример предполагает, что у вас есть Mapping50K_Xba240.CDF файл, хранящийся в C:\AffyLibFiles\, и что ваша текущая папка указывает на расположение, содержащее Mapping50K_Xba240.na25.annot.csv файл аннотации.
Используйте affyread функция для создания структуры, содержащей информацию из Mapping50K_Xba240.CDF файл библиотеки.
cdf = affyread('C:\AffyLibFiles\Mapping50K_Xba240.CDF');
Создайте переменную, содержащую массив ячеек из имен наборов зондов, которые хранятся в Name поле ProbeSets поле cdf структура.
probesetIDs = {cdf.ProbeSets.Name}';
Возвращает структуру, содержащую информацию о аннотации для всех наборов зондов в Mapping50K_Xba240.na25.annot.csv файл аннотации.
snpInfo = affysnpannotread('Mapping50K_Xba240.na25.annot.csv',probesetIDs)
snpInfo =
ProbeSetIDs: {59024x1 cell}
Chromosome: [59024x1 int8]
ChromPosition: [59024x1 double]
Cytoband: {59024x1 cell}
Sequence: {59024x1 cell}
AlleleA: {59024x1 cell}
AlleleB: {59024x1 cell}
Accession: {59024x1 cell}
FragmentLength: [59024x1 double]