exponenta event banner

ilmnbslookup

Поиск целевой последовательности (зонда) Illumina BeadStudio и информации аннотации

Синтаксис

AnnotStruct = ilmnbslookup(AnnotationFile, ID)
AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue)

Входные аргументы

AnnotationFile

Символьный вектор или строка, указывающая имя файла, путь и имя файла аннотации Illumina ® (формат CSV, BGX или TXT). Если указано только имя файла, он должен находиться в пути поиска MATLAB ® или в текущей папке.

Совет

Можно загрузить файлы аннотаций Illumina, например HumanRef-8_V3_0_R0_11282963_A.bgx, с веб-сайта Illumina.

ID

Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, представляющих уникальный идентификатор (ы) для одного или нескольких целевых объектов (зондов) в микрочипе Illumina .

Совет

По умолчанию ID должны соответствовать Search_key поле в AnnotationFile. Однако можно использовать идентификатор, соответствующий любому из полей в AnnotationFile, затем установите 'LookUpField' соответствующим образом. Например, если требуется найти информацию аннотации только для целей (зондов) на хромосоме 7, установите ID кому '7', затем установить LookUpFieldValue кому 'Chromosome'. Список всех полей в AnnotationFile, см. следующие таблицы.

LookUpFieldValue

Поле в AnnotationFile где ilmnbslookup ищет указанное ID. По умолчанию: Search_key поле.

Совет

Установите это свойство таким образом, чтобы оно соответствовало ID используется в качестве входных данных.

Выходные аргументы

AnnotStruct

Структура, содержащая последовательность зондов и информацию аннотаций для одной или нескольких целей (зондов), указанных в ID, и AnnotationFile, файл аннотаций Illumina.

AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.

Описание

AnnotStruct = ilmnbslookup(AnnotationFile, ID) прибыль AnnotStructструктура, содержащая последовательность зондов и информацию аннотаций для одной или нескольких целей (зондов), указанных ID, и AnnotationFile, файл аннотаций Illumina (формат CSV, BGX или TXT).

AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.

Структура, созданная из CSV-файла аннотации Illumina

ОбластьОписание
Search_keyВнутренний идентификатор целевого объекта, полезный для пользовательского массива проектирования
TargetУникальный идентификатор целевого объекта
ProbeIdИдентификатор зонда Illumina
GidИдентификатор гена GenBank ®
TranscriptВнутренний идентификатор транскрипта Illumina
AccessionРегистрационный номер GenBank для гена
SymbolКак правило, символ гена
TypeТип зонда
StartНачальное положение последовательности зондов в записи GenBank
Probe_SequenceПоследовательность зонда
DefinitionПоле определения из записи GenBank
OntologyТермины генной онтологии, связанные с геном
SynonymСинонимы для гена (из записи GenBank)

Структура, созданная из файла аннотаций BGX или TXT

ОбластьОписание
AccessionРегистрационный номер GenBank для гена
Array_Address_IdИдентификатор декодера
ChromosomeХромосома, на которой расположен ген
CytobandЦитогенетическая область бандажа хромосомы, на которой расположен ген, связанный с мишенью
DefinitionПоле определения из записи GenBank
Entrez_Gene_IDИдентификатор базы данных Entrez Gene для гена
GIИдентификатор GenBank для гена
ILMN_GeneСимвол иллюминаторного гена
Obsolete_Probe_IdИдентификатор зонда перед файлами аннотаций BGX
Ontology_ComponentГенная онтология клеточные компоненты, связанные с геном
Ontology_FunctionМолекулярные функции онтологии, связанные с геном
Ontology_ProcessБиологические процессы, связанные с геном
Probe_Chr_OrientationОриентация зонда на построение генома NCBI
Probe_CoordinatesГеномное положение зонда в построении генома NCBI
Probe_IdИдентификатор иллюминапробы
Probe_SequenceПоследовательность зонда
Probe_StartНачальное положение зонда относительно 5' конец последовательности исходного транскрипта
Probe_TypeИнформация о том, на что нацелен зонд
Protein_ProductНомер присоединения белка NCBI
RefSeq_IDИдентификатор из базы данных NCBI RefSeq
Reporter_Composite_mapИнформация, связанная с контрольными зондами
Reporter_Group_NameИнформация, связанная с контрольными зондами
Reporter_Group_idИнформация, связанная с контрольными зондами
Search_KeyВнутренний идентификатор целевого объекта, полезный для пользовательского массива проектирования
SourceИсточник, из которого получена последовательность транскрипта
Source_Reference_IDИдентификатор источника
SpeciesВиды, связанные с геном
SymbolКак правило, символ гена
SynonymsСинонимы для гена (из записи GenBank)
TranscriptИдентификатор иллюминаторного транскрипта
Unigene_IDИдентификатор из базы данных NCBI UniGene

AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue) ищет ID в файле аннотаций в поле, указанном LookUpFieldValue. По умолчанию: Search_key поле.

Примеры

Примечание

Файл экспрессии генов, TumorAdjacent-probe-raw.txtи файл аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx, используемые в следующих примерах, не поставляются с программным обеспечением Bioinformatics Toolbox™.

Пример 38. Поиск информации аннотации для одной цели (зонд)
  1. Считывайте содержимое файла с разделителями табуляции, экспортированного из программы Illumina BeadStudio™ в структуру MATLAB.

    ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt')
    
    ilmnStruct = 
    
                 Header: [1x1 struct]
               TargetID: {22184x1 cell}
            ColumnNames: {1x37 cell}
                   Data: [22184x37 double]
        TextColumnNames: {1x23 cell}
               TextData: {22184x23 cell}
  2. Найти номер Search_key в столбце TextColumnNames массив ячеек, который возвращается в ilmnStruct структура по ilmnbsread функция.

    srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames))
    
    srchCol =
    
         1
  3. Поиск последовательности зондов и информации аннотаций для 10-й записи в файле аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx.

    annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',... 
                               ilmnStruct.TextData{10,srchCol})
    annotation = 
    
                     Accession: 'NM_144670.2'
              Array_Address_Id: '0004050154'
                    Chromosome: '12'
                      Cytoband: '12p13.31b'
                    Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.'
                Entrez_Gene_ID: '144568'
                            GI: '74271844'
                     ILMN_Gene: 'A2ML1'
             Obsolete_Probe_Id: ''
            Ontology_Component: ''
             Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]'
              Ontology_Process: ''
         Probe_Chr_Orientation: '+'
             Probe_Coordinates: '8920412-8920461'
                      Probe_Id: 'ILMN_2136495'
                Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT'
                   Probe_Start: '4889'
                    Probe_Type: 'S'
               Protein_Product: 'NP_653271.2'
                     RefSeq_ID: 'NM_144670.2'
        Reporter_Composite_map: ''
           Reporter_Group_Name: ''
             Reporter_Group_id: ''
                    Search_Key: 'ILMN_17375'
                        Source: 'RefSeq'
           Source_Reference_ID: 'NM_144670.2'
                       Species: 'Homo sapiens'
                        Symbol: 'A2ML1'
                      Synonyms: [1x141 char]
                    Transcript: 'ILMN_17375'
                    Unigene_ID: ''
Пример 39. Поиск информации аннотации для подмножества целевых объектов (проб)

Используйте ilmnbslookup функции с помощью 'LookUpField' свойство для поиска информации аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.

chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
                               '12','LookUpField','Chromosome')

chr12annotation = 

                 Accession: {1x1186 cell}
          Array_Address_Id: {1x1186 cell}
                Chromosome: {1x1186 cell}
                  Cytoband: {1x1186 cell}
                Definition: {1x1186 cell}
            Entrez_Gene_ID: {1x1186 cell}
                        GI: {1x1186 cell}
                 ILMN_Gene: {1x1186 cell}
         Obsolete_Probe_Id: {1x1186 cell}
        Ontology_Component: {1x1186 cell}
         Ontology_Function: {1x1186 cell}
          Ontology_Process: {1x1186 cell}
     Probe_Chr_Orientation: {1x1186 cell}
         Probe_Coordinates: {1x1186 cell}
                  Probe_Id: {1x1186 cell}
            Probe_Sequence: {1x1186 cell}
               Probe_Start: {1x1186 cell}
                Probe_Type: {1x1186 cell}
           Protein_Product: {1x1186 cell}
                 RefSeq_ID: {1x1186 cell}
    Reporter_Composite_map: ''
       Reporter_Group_Name: ''
         Reporter_Group_id: ''
                Search_Key: {1x1186 cell}
                    Source: {1x1186 cell}
       Source_Reference_ID: {1x1186 cell}
                   Species: {1x1186 cell}
                    Symbol: {1x1186 cell}
                  Synonyms: {1x1186 cell}
                Transcript: {1x1186 cell}
                Unigene_ID: {1x1186 cell}

Выходная структура показывает, что на хромосоме 12 находится 1186 мишеней.

См. также

Представлен в R2008a