ilmnbslookup

Просмотр целевой последовательности (зонда) Illumina BeadStudio и информации о аннотации

Синтаксис

AnnotStruct = ilmnbslookup(AnnotationFile, ID)
AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue)

Входные параметры

AnnotationFile

Вектор символов или строка, задающая имя файла или путь и имя файла Illumina® файл аннотации (формат CSV, BGX или TXT). Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке.

Совет

Можно скачать файлы аннотации Illumina, такие как HumanRef-8_V3_0_R0_11282963_A.bgx, с веб-сайта Illumina.

ID

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, представляющих уникальные идентификаторы (идентификаторы ) (ы) для одной или нескольких целей (зондов) в микромассиве Illumina .

Совет

По умолчанию ID должен совпадать с Search_key поле в AnnotationFile. Однако можно использовать идентификатор, который соответствует любому из полей в AnnotationFile, затем установите 'LookUpField' свойство соответствующим образом. Например, если вы хотите искать информацию аннотации только для целей (зондов) в хромосоме 7, установите ID на '7', затем установите LookUpFieldValue на 'Chromosome'. Список всех полей в AnnotationFileСм. следующие таблицы.

LookUpFieldValue

Поле в AnnotationFile где ilmnbslookup ищет заданную ID. По умолчанию это Search_key поле.

Совет

Установите это свойство так, чтобы оно соответствовало ID вы используете как вход.

Выходные аргументы

AnnotStruct

Структура, содержащая последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданных ID, и по AnnotationFile, файл аннотации Illumina.

AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.

Описание

AnnotStruct = ilmnbslookup(AnnotationFile, ID) возвращает AnnotStruct, структуру, содержащую последовательность зондов и информацию аннотации для одной или нескольких целей (зондов), заданную как ID, и по AnnotationFile, файл аннотации Illumina (формат CSV, BGX или TXT).

AnnotStruct содержит те же поля, что и AnnotationFile. Поля описаны в следующих двух таблицах.

Структура, созданная из файла аннотации Illumina CSV

ОбластьОписание
Search_keyВнутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта
TargetУникальный идентификатор для целевого устройства
ProbeIdИдентификатор зонда Illumina
GidGenBank® идентификатор для гена
TranscriptВнутренний идентификатор транскрипта Illumina
AccessionНомер присоединения GenBank для гена
SymbolКак правило, символ гена
TypeТип зонда
StartНачальное положение последовательности зондов в записи GenBank
Probe_SequenceПоследовательность зонда
DefinitionПоле определения из записи GenBank
OntologyГенные онтологические термины, сопоставленные с геном
SynonymСинонимы гена (из записи GenBank)

Структура, созданная из файла аннотации BGX или TXT

ОбластьОписание
AccessionНомер присоединения GenBank для гена
Array_Address_IdИдентификатор декодера
ChromosomeХромосома, на которой расположен ген
CytobandЦитогенетическая область хромосомы, на которой расположен ген, сопоставленный с мишенью
DefinitionПоле определения из записи GenBank
Entrez_Gene_IDИдентификатор базы данных Entrez Gene для гена
GIИдентификатор GenBank для гена
ILMN_GeneСимвол светящегося гена
Obsolete_Probe_IdИдентификатор пробы перед файлами аннотации BGX
Ontology_ComponentГенные онтологические клеточные компоненты, связанные с геном
Ontology_FunctionМолекулярные функции генной онтологии, связанные с геном
Ontology_ProcessГенная онтология биологических процессов, связанных с геном
Probe_Chr_OrientationОриентация зонда на построении генома NCBI
Probe_CoordinatesГеномное положение зонда на построении генома NCBI
Probe_IdИдентификатор иллюминапроба
Probe_SequenceПоследовательность зонда
Probe_StartНачните положение зонда относительно 5 ' конец исходной последовательности транскриптов
Probe_TypeИнформация о том, на что нацелен зонд
Protein_ProductНомер присоединения белка NCBI
RefSeq_IDИдентификатор из базы данных NCBI RefSeq
Reporter_Composite_mapИнформация, связанная с управляющими зондами
Reporter_Group_NameИнформация, связанная с управляющими зондами
Reporter_Group_idИнформация, связанная с управляющими зондами
Search_KeyВнутренний идентификатор для целевого устройства, полезный для пользовательского массива проекта
SourceИсточник, из которого была получена последовательность транскриптов
Source_Reference_IDИдентификатор источника
SpeciesВиды, связанные с геном
SymbolКак правило, символ гена
SynonymsСинонимы гена (из записи GenBank)
TranscriptИдентификатор осветительного транскрипта
Unigene_IDИдентификатор из базы данных UniGene NCBI

AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue) ищет ID в файле аннотации в поле, заданном LookUpFieldValue. По умолчанию это Search_key поле.

Примеры

Примечание

Файл экспрессии генов, TumorAdjacent-probe-raw.txt, и файл аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx, используемые в следующих примерах, не предоставляются с программным обеспечением Bioinformatics Toolbox™.

Пример 38. Поиск информации аннотации для одной цели (зонд)
  1. Считайте содержимое файла с разделителем табуляций, экспортированного из программного обеспечения Illumina BeadStudio™ в структуру MATLAB.

    ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt')
    
    ilmnStruct = 
    
                 Header: [1x1 struct]
               TargetID: {22184x1 cell}
            ColumnNames: {1x37 cell}
                   Data: [22184x37 double]
        TextColumnNames: {1x23 cell}
               TextData: {22184x23 cell}
  2. Найдите номер Search_key столбец в TextColumnNames массив ячеек, который возвращается в ilmnStruct структуру по ilmnbsread функция.

    srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames))
    
    srchCol =
    
         1
  3. Проверьте последовательность зондов и информацию о аннотациях для 10-й записи в файле аннотаций, HumanRef-8_V3_0_R0_11282963_A.bgx.

    annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',... 
                               ilmnStruct.TextData{10,srchCol})
    annotation = 
    
                     Accession: 'NM_144670.2'
              Array_Address_Id: '0004050154'
                    Chromosome: '12'
                      Cytoband: '12p13.31b'
                    Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.'
                Entrez_Gene_ID: '144568'
                            GI: '74271844'
                     ILMN_Gene: 'A2ML1'
             Obsolete_Probe_Id: ''
            Ontology_Component: ''
             Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]'
              Ontology_Process: ''
         Probe_Chr_Orientation: '+'
             Probe_Coordinates: '8920412-8920461'
                      Probe_Id: 'ILMN_2136495'
                Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT'
                   Probe_Start: '4889'
                    Probe_Type: 'S'
               Protein_Product: 'NP_653271.2'
                     RefSeq_ID: 'NM_144670.2'
        Reporter_Composite_map: ''
           Reporter_Group_Name: ''
             Reporter_Group_id: ''
                    Search_Key: 'ILMN_17375'
                        Source: 'RefSeq'
           Source_Reference_ID: 'NM_144670.2'
                       Species: 'Homo sapiens'
                        Symbol: 'A2ML1'
                      Synonyms: [1x141 char]
                    Transcript: 'ILMN_17375'
                    Unigene_ID: ''
Пример 39. Поиск информации аннотации для подмножества целей (зондов)

Используйте ilmnbslookup функция со 'LookUpField' свойство для поиска информации аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.

chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
                               '12','LookUpField','Chromosome')

chr12annotation = 

                 Accession: {1x1186 cell}
          Array_Address_Id: {1x1186 cell}
                Chromosome: {1x1186 cell}
                  Cytoband: {1x1186 cell}
                Definition: {1x1186 cell}
            Entrez_Gene_ID: {1x1186 cell}
                        GI: {1x1186 cell}
                 ILMN_Gene: {1x1186 cell}
         Obsolete_Probe_Id: {1x1186 cell}
        Ontology_Component: {1x1186 cell}
         Ontology_Function: {1x1186 cell}
          Ontology_Process: {1x1186 cell}
     Probe_Chr_Orientation: {1x1186 cell}
         Probe_Coordinates: {1x1186 cell}
                  Probe_Id: {1x1186 cell}
            Probe_Sequence: {1x1186 cell}
               Probe_Start: {1x1186 cell}
                Probe_Type: {1x1186 cell}
           Protein_Product: {1x1186 cell}
                 RefSeq_ID: {1x1186 cell}
    Reporter_Composite_map: ''
       Reporter_Group_Name: ''
         Reporter_Group_id: ''
                Search_Key: {1x1186 cell}
                    Source: {1x1186 cell}
       Source_Reference_ID: {1x1186 cell}
                   Species: {1x1186 cell}
                    Symbol: {1x1186 cell}
                  Synonyms: {1x1186 cell}
                Transcript: {1x1186 cell}
                Unigene_ID: {1x1186 cell}

Структура output указывает, что на хромосоме 12 расположено 1186 мишеней.

См. также

Введенный в R2008a