Просмотр целевой последовательности (зонда) Illumina BeadStudio и информации о аннотации
AnnotStruct
=
ilmnbslookup(AnnotationFile
, ID
)
AnnotStruct
=
ilmnbslookup(AnnotationFile
, ID
,
'LookUpField', LookUpFieldValue
)
AnnotationFile | Вектор символов или строка, задающая имя файла или путь и имя файла Illumina® файл аннотации (формат CSV, BGX или TXT). Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке. Совет Можно скачать файлы аннотации Illumina, такие как |
ID | Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, представляющих уникальные идентификаторы (идентификаторы ) (ы) для одной или нескольких целей (зондов) в микромассиве Illumina . Совет По умолчанию |
LookUpFieldValue | Поле в Совет Установите это свойство так, чтобы оно соответствовало |
AnnotStruct | Структура, содержащая последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданных
|
возвращает AnnotStruct
=
ilmnbslookup(AnnotationFile
, ID
)AnnotStruct
, структуру, содержащую последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданную как ID
, и по AnnotationFile
, файл аннотации Illumina (формат CSV, BGX или TXT).
AnnotStruct
содержит те же поля, что и AnnotationFile
. Поля описаны в следующих двух таблицах.
Структура, созданная из файла аннотации Illumina CSV
Область | Описание |
---|---|
Search_key | Внутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта |
Target | Уникальный идентификатор для целевого устройства |
ProbeId | Идентификатор зонда Illumina |
Gid | GenBank® идентификатор для гена |
Transcript | Внутренний идентификатор транскрипта Illumina |
Accession | Номер присоединения GenBank для гена |
Symbol | Как правило, символ гена |
Type | Тип зонда |
Start | Начальное положение последовательности зондов в записи GenBank |
Probe_Sequence | Последовательность зонда |
Definition | Поле определения из записи GenBank |
Ontology | Генные онтологические термины, сопоставленные с геном |
Synonym | Синонимы гена (из записи GenBank) |
Структура, созданная из файла аннотации BGX или TXT
Область | Описание |
---|---|
Accession | Номер присоединения GenBank для гена |
Array_Address_Id | Идентификатор декодера |
Chromosome | Хромосома, на которой расположен ген |
Cytoband | Цитогенетическая область хромосомы, на которой расположен ген, сопоставленный с мишенью |
Definition | Поле определения из записи GenBank |
Entrez_Gene_ID | Идентификатор базы данных Entrez Gene для гена |
GI | Идентификатор GenBank для гена |
ILMN_Gene | Символ светящегося гена |
Obsolete_Probe_Id | Идентификатор пробы перед файлами аннотации BGX |
Ontology_Component | Генные онтологические клеточные компоненты, связанные с геном |
Ontology_Function | Молекулярные функции генной онтологии, связанные с геном |
Ontology_Process | Генная онтология биологических процессов, связанных с геном |
Probe_Chr_Orientation | Ориентация зонда на построении генома NCBI |
Probe_Coordinates | Геномное положение зонда на построении генома NCBI |
Probe_Id | Идентификатор иллюминапроба |
Probe_Sequence | Последовательность зонда |
Probe_Start | Начните положение зонда относительно 5 ' конец исходной последовательности транскриптов |
Probe_Type | Информация о том, на что нацелен зонд |
Protein_Product | Номер присоединения белка NCBI |
RefSeq_ID | Идентификатор из базы данных NCBI RefSeq |
Reporter_Composite_map | Информация, связанная с управляющими зондами |
Reporter_Group_Name | Информация, связанная с управляющими зондами |
Reporter_Group_id | Информация, связанная с управляющими зондами |
Search_Key | Внутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта |
Source | Источник, из которого была получена последовательность транскриптов |
Source_Reference_ID | Идентификатор источника |
Species | Виды, связанные с геном |
Symbol | Как правило, символ гена |
Synonyms | Синонимы гена (из записи GenBank) |
Transcript | Идентификатор осветительного транскрипта |
Unigene_ID | Идентификатор из базы данных UniGene NCBI |
ищет AnnotStruct
=
ilmnbslookup(AnnotationFile
, ID
,
'LookUpField', LookUpFieldValue
)ID
в файле аннотации в поле, заданном LookUpFieldValue
. По умолчанию это Search_key
поле.
Примечание
Файл экспрессии генов, TumorAdjacent-probe-raw.txt
, и файл аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx
, используемые в следующих примерах, не предоставляются с программным обеспечением Bioinformatics Toolbox™.
Считайте содержимое файла с разделителем табуляций, экспортированного из программного обеспечения Illumina BeadStudio™ в структуру MATLAB.
ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt') ilmnStruct = Header: [1x1 struct] TargetID: {22184x1 cell} ColumnNames: {1x37 cell} Data: [22184x37 double] TextColumnNames: {1x23 cell} TextData: {22184x23 cell}
Найдите номер Search_key
столбец в TextColumnNames
массив ячеек, который возвращается в ilmnStruct
структуру по ilmnbsread
функция.
srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames)) srchCol = 1
Проверьте последовательность зондов и информацию о аннотациях для 10-й записи в файле аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx
.
annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',... ilmnStruct.TextData{10,srchCol}) annotation = Accession: 'NM_144670.2' Array_Address_Id: '0004050154' Chromosome: '12' Cytoband: '12p13.31b' Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.' Entrez_Gene_ID: '144568' GI: '74271844' ILMN_Gene: 'A2ML1' Obsolete_Probe_Id: '' Ontology_Component: '' Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]' Ontology_Process: '' Probe_Chr_Orientation: '+' Probe_Coordinates: '8920412-8920461' Probe_Id: 'ILMN_2136495' Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT' Probe_Start: '4889' Probe_Type: 'S' Protein_Product: 'NP_653271.2' RefSeq_ID: 'NM_144670.2' Reporter_Composite_map: '' Reporter_Group_Name: '' Reporter_Group_id: '' Search_Key: 'ILMN_17375' Source: 'RefSeq' Source_Reference_ID: 'NM_144670.2' Species: 'Homo sapiens' Symbol: 'A2ML1' Synonyms: [1x141 char] Transcript: 'ILMN_17375' Unigene_ID: ''
Используйте ilmnbslookup
функция со 'LookUpField'
свойство для поиска информации аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx
.
chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',... '12','LookUpField','Chromosome') chr12annotation = Accession: {1x1186 cell} Array_Address_Id: {1x1186 cell} Chromosome: {1x1186 cell} Cytoband: {1x1186 cell} Definition: {1x1186 cell} Entrez_Gene_ID: {1x1186 cell} GI: {1x1186 cell} ILMN_Gene: {1x1186 cell} Obsolete_Probe_Id: {1x1186 cell} Ontology_Component: {1x1186 cell} Ontology_Function: {1x1186 cell} Ontology_Process: {1x1186 cell} Probe_Chr_Orientation: {1x1186 cell} Probe_Coordinates: {1x1186 cell} Probe_Id: {1x1186 cell} Probe_Sequence: {1x1186 cell} Probe_Start: {1x1186 cell} Probe_Type: {1x1186 cell} Protein_Product: {1x1186 cell} RefSeq_ID: {1x1186 cell} Reporter_Composite_map: '' Reporter_Group_Name: '' Reporter_Group_id: '' Search_Key: {1x1186 cell} Source: {1x1186 cell} Source_Reference_ID: {1x1186 cell} Species: {1x1186 cell} Symbol: {1x1186 cell} Synonyms: {1x1186 cell} Transcript: {1x1186 cell} Unigene_ID: {1x1186 cell}
Структура output указывает, что на хромосоме 12 расположено 1186 мишеней.