ilmnbslookup

Ищите цель Illumina BeadStudio (тестовая) последовательность и информация об аннотации

Синтаксис

AnnotStruct = ilmnbslookup(AnnotationFile, ID)
AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue)

Входные параметры

AnnotationFile

Вектор символов или строка, задающая имя файла или путь и имя файла файла аннотации Illumina® (CSV, BGX или формат TXT). Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в текущей папке.

Совет

Можно загрузить файлы аннотации Illumina, такие как HumanRef-8_V3_0_R0_11282963_A.bgx, с веб-сайта Illumina.

ID

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, представляющий уникальный идентификатор (идентификаторы) для одной или нескольких целей (зонды) на микромассиве Illumina.

Совет

По умолчанию ID должен совпадать с полем Search_key в AnnotationFile. Однако можно использовать идентификатор, который соответствует любому из полей в AnnotationFile, затем устанавливает свойство 'LookUpField' соответственно. Например, если вы хотите искать информацию об аннотации для целей (зонды) на хромосоме 7 только, установите ID на '7', затем установите LookUpFieldValue на 'Chromosome'. Для списка всех полей в AnnotationFile см. следующие таблицы.

LookUpFieldValue

Поле в AnnotationFile, где ilmnbslookup ищет заданный ID. Значением по умолчанию является поле Search_key.

Совет

Установите это свойство так, чтобы оно соответствовало ID, который вы используете в качестве входа.

Выходные аргументы

AnnotStruct

Структура, содержащая тестовую последовательность и информацию об аннотации для одной или нескольких целей (зонды), заданные ID, и AnnotationFile, файлом аннотации Illumina.

AnnotStruct содержит те же поля как AnnotationFile. Поля описаны в следующих двух таблицах.

Описание

AnnotStruct = ilmnbslookup(AnnotationFile, ID) возвращает AnnotStruct, структура, содержащая тестовую последовательность и информацию об аннотации для одной или нескольких целей (зонды), заданные ID, и AnnotationFile, файл аннотации Illumina (CSV, BGX или формат TXT).

AnnotStruct содержит те же поля как AnnotationFile. Поля описаны в следующих двух таблицах.

Структура, созданная из файла аннотации CSV Illumina

Поле Описание
Search_keyВнутренний идентификатор для цели, полезной для массива индивидуального проекта
TargetУникальный идентификатор для цели
ProbeIdIllumina зондируют идентификатор
GidИдентификатор GenBank® для гена
TranscriptIllumina внутренний идентификатор расшифровки стенограммы
AccessionИнвентарный номер GenBank для гена
SymbolКак правило, название гена
TypeТестовый тип
StartСтартовая позиция тестовой последовательности в записи GenBank
Probe_SequenceПоследовательность зонда
DefinitionПоле Definition от записи GenBank
OntologyГенные условия Онтологии сопоставлены с геном
SynonymСинонимы для гена (от записи GenBank)

Структура, созданная из BGX или файла аннотации TXT

Поле Описание
AccessionИнвентарный номер GenBank для гена
Array_Address_IdИдентификатор декодера
ChromosomeХромосома, на которой расположен ген
CytobandЦитогенетическая область соединения хромосомы, на которой расположен ген, сопоставленный с целью
DefinitionПоле Definition от записи GenBank
Entrez_Gene_IDИдентификатор базы данных Entrez Gene для гена
GIИдентификатор GenBank для гена
ILMN_GeneНазвание гена Illuminainternal
Obsolete_Probe_IdТестовый идентификатор перед файлами аннотации BGX
Ontology_ComponentГенные сотовые компоненты Онтологии сопоставлены с геном
Ontology_FunctionГенная Онтология молекулярные функции сопоставлена с геном
Ontology_ProcessГенная Онтология биологические процессы сопоставлена с геном
Probe_Chr_OrientationОриентация зонда на сборке генома NCBI
Probe_CoordinatesГеномное положение зонда на сборке генома NCBI
Probe_IdИдентификатор Illuminaprobe
Probe_SequenceПоследовательность зонда
Probe_StartЗапустите положение зонда относительно 5' конец исходной последовательности расшифровки стенограммы
Probe_TypeИнформация о том, для чего предназначается зонд
Protein_ProductИнвентарный номер белка NCBI
RefSeq_IDИдентификатор от базы данных NCBI RefSeq
Reporter_Composite_mapИнформация сопоставлена с зондами управления
Reporter_Group_NameИнформация сопоставлена с зондами управления
Reporter_Group_idИнформация сопоставлена с зондами управления
Search_KeyВнутренний идентификатор для цели, полезной для массива индивидуального проекта
SourceИсточник, из которого была получена последовательность расшифровки стенограммы
Source_Reference_IDИдентификатор источника
SpeciesРазновидности сопоставлены с геном
SymbolКак правило, название гена
SynonymsСинонимы для гена (от записи GenBank)
TranscriptИдентификатор расшифровки стенограммы Illuminainternal
Unigene_IDИдентификатор от базы данных NCBI UniGene

AnnotStruct = ilmnbslookup(AnnotationFile, ID, 'LookUpField', LookUpFieldValue) ищет ID в файле аннотации в поле, заданном LookUpFieldValue. Значением по умолчанию является поле Search_key.

Примеры

Примечание

Файлу экспрессии гена, TumorAdjacent-probe-raw.txt, и файлу аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx, используемому в следующих примерах, не предоставляют программное обеспечение Bioinformatics Toolbox™.

Пример 49. Ищите информацию об аннотации для единой цели (зонд)
  1. Считайте содержимое файла с разделением табуляцией, экспортируемого из программного обеспечения Illumina BeadStudio™ в структуру MATLAB.

    ilmnStruct = ilmnbsread('TumorAdjacent-probe-raw.txt')
    
    ilmnStruct = 
    
                 Header: [1x1 struct]
               TargetID: {22184x1 cell}
            ColumnNames: {1x37 cell}
                   Data: [22184x37 double]
        TextColumnNames: {1x23 cell}
               TextData: {22184x23 cell}
  2. Найдите количество столбца Search_key в массиве ячеек TextColumnNames, который возвращен в структуре ilmnStruct функцией ilmnbsread.

    srchCol = find(strcmpi('Search_Key',ilmnStruct.TextColumnNames))
    
    srchCol =
    
         1
  3. Ищите тестовую последовательность и информацию об аннотации для 10-й записи в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.

    annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',... 
                               ilmnStruct.TextData{10,srchCol})
    annotation = 
    
                     Accession: 'NM_144670.2'
              Array_Address_Id: '0004050154'
                    Chromosome: '12'
                      Cytoband: '12p13.31b'
                    Definition: 'Homo sapiens alpha-2-macroglobulin-like 1 (A2ML1), mRNA.'
                Entrez_Gene_ID: '144568'
                            GI: '74271844'
                     ILMN_Gene: 'A2ML1'
             Obsolete_Probe_Id: ''
            Ontology_Component: ''
             Ontology_Function: 'endopeptidase inhibitor activity [goid 4866] [evidence IEA]'
              Ontology_Process: ''
         Probe_Chr_Orientation: '+'
             Probe_Coordinates: '8920412-8920461'
                      Probe_Id: 'ILMN_2136495'
                Probe_Sequence: 'TGTAATCGCAGCCCCTTGGAAGGCCAAGGCAGGAGAATCGCCTCAACACT'
                   Probe_Start: '4889'
                    Probe_Type: 'S'
               Protein_Product: 'NP_653271.2'
                     RefSeq_ID: 'NM_144670.2'
        Reporter_Composite_map: ''
           Reporter_Group_Name: ''
             Reporter_Group_id: ''
                    Search_Key: 'ILMN_17375'
                        Source: 'RefSeq'
           Source_Reference_ID: 'NM_144670.2'
                       Species: 'Homo sapiens'
                        Symbol: 'A2ML1'
                      Synonyms: [1x141 char]
                    Transcript: 'ILMN_17375'
                    Unigene_ID: ''
Пример 50. Ищите информацию об аннотации для подмножества целей (зонды)

Используйте функцию ilmnbslookup со свойством 'LookUpField' искать информацию об аннотации для всех целей, расположенных на хромосоме 12 в файле аннотации, HumanRef-8_V3_0_R0_11282963_A.bgx.

chr12annotation = ilmnbslookup('HumanRef-8_V3_0_R0_11282963_A.bgx',...
                               '12','LookUpField','Chromosome')

chr12annotation = 

                 Accession: {1x1186 cell}
          Array_Address_Id: {1x1186 cell}
                Chromosome: {1x1186 cell}
                  Cytoband: {1x1186 cell}
                Definition: {1x1186 cell}
            Entrez_Gene_ID: {1x1186 cell}
                        GI: {1x1186 cell}
                 ILMN_Gene: {1x1186 cell}
         Obsolete_Probe_Id: {1x1186 cell}
        Ontology_Component: {1x1186 cell}
         Ontology_Function: {1x1186 cell}
          Ontology_Process: {1x1186 cell}
     Probe_Chr_Orientation: {1x1186 cell}
         Probe_Coordinates: {1x1186 cell}
                  Probe_Id: {1x1186 cell}
            Probe_Sequence: {1x1186 cell}
               Probe_Start: {1x1186 cell}
                Probe_Type: {1x1186 cell}
           Protein_Product: {1x1186 cell}
                 RefSeq_ID: {1x1186 cell}
    Reporter_Composite_map: ''
       Reporter_Group_Name: ''
         Reporter_Group_id: ''
                Search_Key: {1x1186 cell}
                    Source: {1x1186 cell}
       Source_Reference_ID: {1x1186 cell}
                   Species: {1x1186 cell}
                    Symbol: {1x1186 cell}
                  Synonyms: {1x1186 cell}
                Transcript: {1x1186 cell}
                Unigene_ID: {1x1186 cell}

Выходная структура указывает, что существует 1 186 целей, расположенных на хромосоме 12.

Смотрите также

Введенный в R2008a

Для просмотра документации необходимо авторизоваться на сайте