Поиск целевой последовательности (зонда) Illumina BeadStudio и информации аннотации
AnnotStruct = ilmnbslookup(AnnotationFile, ID)
AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue)
AnnotationFile | Символьный вектор или строка, указывающая имя файла, путь и имя файла аннотации Illumina ® (формат CSV, BGX или TXT). Если указано только имя файла, он должен находиться в пути поиска MATLAB ® или в текущей папке. Совет Можно загрузить файлы аннотаций Illumina, например |
ID | Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, представляющих уникальный идентификатор (ы) для одного или нескольких целевых объектов (зондов) в микрочипе Illumina . Совет По умолчанию |
LookUpFieldValue | Поле в Совет Установите это свойство таким образом, чтобы оно соответствовало |
AnnotStruct | Структура, содержащая последовательность зондов и информацию аннотаций для одной или нескольких целей (зондов), указанных в
|
прибыль AnnotStruct = ilmnbslookup(AnnotationFile, ID)AnnotStructструктура, содержащая последовательность зондов и информацию аннотаций для одной или нескольких целей (зондов), указанных ID, и AnnotationFile, файл аннотаций Illumina (формат CSV, BGX или TXT).
AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.
Структура, созданная из CSV-файла аннотации Illumina
| Область | Описание |
|---|---|
Search_key | Внутренний идентификатор целевого объекта, полезный для пользовательского массива проектирования |
Target | Уникальный идентификатор целевого объекта |
ProbeId | Идентификатор зонда Illumina |
Gid | Идентификатор гена GenBank ® |
Transcript | Внутренний идентификатор транскрипта Illumina |
Accession | Регистрационный номер GenBank для гена |
Symbol | Как правило, символ гена |
Type | Тип зонда |
Start | Начальное положение последовательности зондов в записи GenBank |
Probe_Sequence | Последовательность зонда |
Definition | Поле определения из записи GenBank |
Ontology | Термины генной онтологии, связанные с геном |
Synonym | Синонимы для гена (из записи GenBank) |
Структура, созданная из файла аннотаций BGX или TXT
| Область | Описание |
|---|---|
Accession | Регистрационный номер GenBank для гена |
Array_Address_Id | Идентификатор декодера |
Chromosome | Хромосома, на которой расположен ген |
Cytoband | Цитогенетическая область бандажа хромосомы, на которой расположен ген, связанный с мишенью |
Definition | Поле определения из записи GenBank |
Entrez_Gene_ID | Идентификатор базы данных Entrez Gene для гена |
GI | Идентификатор GenBank для гена |
ILMN_Gene | Символ иллюминаторного гена |
Obsolete_Probe_Id | Идентификатор зонда перед файлами аннотаций BGX |
Ontology_Component | Генная онтология клеточные компоненты, связанные с геном |
Ontology_Function | Молекулярные функции онтологии, связанные с геном |
Ontology_Process | Биологические процессы, связанные с геном |
Probe_Chr_Orientation | Ориентация зонда на построение генома NCBI |
Probe_Coordinates | Геномное положение зонда в построении генома NCBI |
Probe_Id | Идентификатор иллюминапробы |
Probe_Sequence | Последовательность зонда |
Probe_Start | Начальное положение зонда относительно 5' конец последовательности исходного транскрипта |
Probe_Type | Информация о том, на что нацелен зонд |
Protein_Product | Номер присоединения белка NCBI |
RefSeq_ID | Идентификатор из базы данных NCBI RefSeq |
Reporter_Composite_map | Информация, связанная с контрольными зондами |
Reporter_Group_Name | Информация, связанная с контрольными зондами |
Reporter_Group_id | Информация, связанная с контрольными зондами |
Search_Key | Внутренний идентификатор целевого объекта, полезный для пользовательского массива проектирования |
Source | Источник, из которого получена последовательность транскрипта |
Source_Reference_ID | Идентификатор источника |
Species | Виды, связанные с геном |
Symbol | Как правило, символ гена |
Synonyms | Синонимы для гена (из записи GenBank) |
Transcript | Идентификатор иллюминаторного транскрипта |
Unigene_ID | Идентификатор из базы данных NCBI UniGene |
ищет AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue)ID в файле аннотаций в поле, указанном LookUpFieldValue. По умолчанию: Search_key поле.
Примечание
Файл экспрессии генов, TumorAdjacent-probe-raw.txtи файл аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx, используемые в следующих примерах, не поставляются с программным обеспечением Bioinformatics Toolbox™.
Считывайте содержимое файла с разделителями табуляции, экспортированного из программы Illumina BeadStudio™ в структуру MATLAB.
ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt')
ilmnStruct =
Header: [1x1 struct]
TargetID: {22184x1 cell}
ColumnNames: {1x37 cell}
Data: [22184x37 double]
TextColumnNames: {1x23 cell}
TextData: {22184x23 cell}Найти номер Search_key в столбце TextColumnNames массив ячеек, который возвращается в ilmnStruct структура по ilmnbsread функция.
srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames))
srchCol =
1Поиск последовательности зондов и информации аннотаций для 10-й записи в файле аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx.
annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
ilmnStruct.TextData{10,srchCol})
annotation =
Accession: 'NM_144670.2'
Array_Address_Id: '0004050154'
Chromosome: '12'
Cytoband: '12p13.31b'
Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.'
Entrez_Gene_ID: '144568'
GI: '74271844'
ILMN_Gene: 'A2ML1'
Obsolete_Probe_Id: ''
Ontology_Component: ''
Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]'
Ontology_Process: ''
Probe_Chr_Orientation: '+'
Probe_Coordinates: '8920412-8920461'
Probe_Id: 'ILMN_2136495'
Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT'
Probe_Start: '4889'
Probe_Type: 'S'
Protein_Product: 'NP_653271.2'
RefSeq_ID: 'NM_144670.2'
Reporter_Composite_map: ''
Reporter_Group_Name: ''
Reporter_Group_id: ''
Search_Key: 'ILMN_17375'
Source: 'RefSeq'
Source_Reference_ID: 'NM_144670.2'
Species: 'Homo sapiens'
Symbol: 'A2ML1'
Synonyms: [1x141 char]
Transcript: 'ILMN_17375'
Unigene_ID: ''Используйте ilmnbslookup функции с помощью 'LookUpField' свойство для поиска информации аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.
chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
'12','LookUpField','Chromosome')
chr12annotation =
Accession: {1x1186 cell}
Array_Address_Id: {1x1186 cell}
Chromosome: {1x1186 cell}
Cytoband: {1x1186 cell}
Definition: {1x1186 cell}
Entrez_Gene_ID: {1x1186 cell}
GI: {1x1186 cell}
ILMN_Gene: {1x1186 cell}
Obsolete_Probe_Id: {1x1186 cell}
Ontology_Component: {1x1186 cell}
Ontology_Function: {1x1186 cell}
Ontology_Process: {1x1186 cell}
Probe_Chr_Orientation: {1x1186 cell}
Probe_Coordinates: {1x1186 cell}
Probe_Id: {1x1186 cell}
Probe_Sequence: {1x1186 cell}
Probe_Start: {1x1186 cell}
Probe_Type: {1x1186 cell}
Protein_Product: {1x1186 cell}
RefSeq_ID: {1x1186 cell}
Reporter_Composite_map: ''
Reporter_Group_Name: ''
Reporter_Group_id: ''
Search_Key: {1x1186 cell}
Source: {1x1186 cell}
Source_Reference_ID: {1x1186 cell}
Species: {1x1186 cell}
Symbol: {1x1186 cell}
Synonyms: {1x1186 cell}
Transcript: {1x1186 cell}
Unigene_ID: {1x1186 cell}Выходная структура показывает, что на хромосоме 12 находится 1186 мишеней.