Просмотр целевой последовательности (зонда) Illumina BeadStudio и информации о аннотации
AnnotStruct =
ilmnbslookup(AnnotationFile, ID)
AnnotStruct =
ilmnbslookup(AnnotationFile, ID,
'LookUpField', LookUpFieldValue)
AnnotationFile | Вектор символов или строка, задающая имя файла или путь и имя файла Illumina® файл аннотации (формат CSV, BGX или TXT). Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке. Совет Можно скачать файлы аннотации Illumina, такие как |
ID | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, представляющих уникальные идентификаторы (идентификаторы ) (ы) для одной или нескольких целей (зондов) в микромассиве Illumina . Совет По умолчанию |
LookUpFieldValue | Поле в Совет Установите это свойство так, чтобы оно соответствовало |
AnnotStruct | Структура, содержащая последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданных
|
возвращает AnnotStruct =
ilmnbslookup(AnnotationFile, ID)AnnotStruct, структуру, содержащую последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданную как ID, и по AnnotationFile, файл аннотации Illumina (формат CSV, BGX или TXT).
AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.
Структура, созданная из файла аннотации Illumina CSV
| Область | Описание |
|---|---|
Search_key | Внутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта |
Target | Уникальный идентификатор для целевого устройства |
ProbeId | Идентификатор зонда Illumina |
Gid | GenBank® идентификатор для гена |
Transcript | Внутренний идентификатор транскрипта Illumina |
Accession | Номер присоединения GenBank для гена |
Symbol | Как правило, символ гена |
Type | Тип зонда |
Start | Начальное положение последовательности зондов в записи GenBank |
Probe_Sequence | Последовательность зонда |
Definition | Поле определения из записи GenBank |
Ontology | Генные онтологические термины, сопоставленные с геном |
Synonym | Синонимы гена (из записи GenBank) |
Структура, созданная из файла аннотации BGX или TXT
| Область | Описание |
|---|---|
Accession | Номер присоединения GenBank для гена |
Array_Address_Id | Идентификатор декодера |
Chromosome | Хромосома, на которой расположен ген |
Cytoband | Цитогенетическая область хромосомы, на которой расположен ген, сопоставленный с мишенью |
Definition | Поле определения из записи GenBank |
Entrez_Gene_ID | Идентификатор базы данных Entrez Gene для гена |
GI | Идентификатор GenBank для гена |
ILMN_Gene | Символ светящегося гена |
Obsolete_Probe_Id | Идентификатор пробы перед файлами аннотации BGX |
Ontology_Component | Генные онтологические клеточные компоненты, связанные с геном |
Ontology_Function | Молекулярные функции генной онтологии, связанные с геном |
Ontology_Process | Генная онтология биологических процессов, связанных с геном |
Probe_Chr_Orientation | Ориентация зонда на построении генома NCBI |
Probe_Coordinates | Геномное положение зонда на построении генома NCBI |
Probe_Id | Идентификатор иллюминапроба |
Probe_Sequence | Последовательность зонда |
Probe_Start | Начните положение зонда относительно 5 ' конец исходной последовательности транскриптов |
Probe_Type | Информация о том, на что нацелен зонд |
Protein_Product | Номер присоединения белка NCBI |
RefSeq_ID | Идентификатор из базы данных NCBI RefSeq |
Reporter_Composite_map | Информация, связанная с управляющими зондами |
Reporter_Group_Name | Информация, связанная с управляющими зондами |
Reporter_Group_id | Информация, связанная с управляющими зондами |
Search_Key | Внутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта |
Source | Источник, из которого была получена последовательность транскриптов |
Source_Reference_ID | Идентификатор источника |
Species | Виды, связанные с геном |
Symbol | Как правило, символ гена |
Synonyms | Синонимы гена (из записи GenBank) |
Transcript | Идентификатор осветительного транскрипта |
Unigene_ID | Идентификатор из базы данных UniGene NCBI |
ищет AnnotStruct =
ilmnbslookup(AnnotationFile, ID,
'LookUpField', LookUpFieldValue)ID в файле аннотации в поле, заданном LookUpFieldValue. По умолчанию это Search_key поле.
Примечание
Файл экспрессии генов, TumorAdjacent-probe-raw.txt, и файл аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx, используемые в следующих примерах, не предоставляются с программным обеспечением Bioinformatics Toolbox™.
Считайте содержимое файла с разделителем табуляций, экспортированного из программного обеспечения Illumina BeadStudio™ в структуру MATLAB.
ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt')
ilmnStruct =
Header: [1x1 struct]
TargetID: {22184x1 cell}
ColumnNames: {1x37 cell}
Data: [22184x37 double]
TextColumnNames: {1x23 cell}
TextData: {22184x23 cell}Найдите номер Search_key столбец в TextColumnNames массив ячеек, который возвращается в ilmnStruct структуру по ilmnbsread функция.
srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames))
srchCol =
1Проверьте последовательность зондов и информацию о аннотациях для 10-й записи в файле аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx.
annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
ilmnStruct.TextData{10,srchCol})
annotation =
Accession: 'NM_144670.2'
Array_Address_Id: '0004050154'
Chromosome: '12'
Cytoband: '12p13.31b'
Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.'
Entrez_Gene_ID: '144568'
GI: '74271844'
ILMN_Gene: 'A2ML1'
Obsolete_Probe_Id: ''
Ontology_Component: ''
Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]'
Ontology_Process: ''
Probe_Chr_Orientation: '+'
Probe_Coordinates: '8920412-8920461'
Probe_Id: 'ILMN_2136495'
Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT'
Probe_Start: '4889'
Probe_Type: 'S'
Protein_Product: 'NP_653271.2'
RefSeq_ID: 'NM_144670.2'
Reporter_Composite_map: ''
Reporter_Group_Name: ''
Reporter_Group_id: ''
Search_Key: 'ILMN_17375'
Source: 'RefSeq'
Source_Reference_ID: 'NM_144670.2'
Species: 'Homo sapiens'
Symbol: 'A2ML1'
Synonyms: [1x141 char]
Transcript: 'ILMN_17375'
Unigene_ID: ''Используйте ilmnbslookup функция со 'LookUpField' свойство для поиска информации аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.
chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
'12','LookUpField','Chromosome')
chr12annotation =
Accession: {1x1186 cell}
Array_Address_Id: {1x1186 cell}
Chromosome: {1x1186 cell}
Cytoband: {1x1186 cell}
Definition: {1x1186 cell}
Entrez_Gene_ID: {1x1186 cell}
GI: {1x1186 cell}
ILMN_Gene: {1x1186 cell}
Obsolete_Probe_Id: {1x1186 cell}
Ontology_Component: {1x1186 cell}
Ontology_Function: {1x1186 cell}
Ontology_Process: {1x1186 cell}
Probe_Chr_Orientation: {1x1186 cell}
Probe_Coordinates: {1x1186 cell}
Probe_Id: {1x1186 cell}
Probe_Sequence: {1x1186 cell}
Probe_Start: {1x1186 cell}
Probe_Type: {1x1186 cell}
Protein_Product: {1x1186 cell}
RefSeq_ID: {1x1186 cell}
Reporter_Composite_map: ''
Reporter_Group_Name: ''
Reporter_Group_id: ''
Search_Key: {1x1186 cell}
Source: {1x1186 cell}
Source_Reference_ID: {1x1186 cell}
Species: {1x1186 cell}
Symbol: {1x1186 cell}
Synonyms: {1x1186 cell}
Transcript: {1x1186 cell}
Unigene_ID: {1x1186 cell}Структура output указывает, что на хромосоме 12 расположено 1186 мишеней.