exponenta event banner

getGenes

Класс: GTFAnnotation

Таблица возврата уникальных генов в GTFAnnotation объект

Описание

genes = getGenes(AnnotObj) прибыль genesтаблица генов, на которые ссылаются экзоны в AnnotObj.

genes = getGenes(AnnotObj,'Reference',R) возвращает ген (ы), которые принадлежат ссылке (ям), указанной ( ым)R.

genes = getGenes(AnnotObj,'Gene',G) возвращает ген (ы), указанный (ые) G.

genes = getGenes(AnnotObj,'Transcript',T) возвращает ген (ы), который содержит транскрипт (ы), указанный ( ые)T.

Входные аргументы

развернуть все

Аннотация GTF, указанная как GTFAnnotation объект.

Имена ссылочных последовательностей, указанных как символьный вектор, строка, строковый вектор, массив ячеек символьных векторов или категориальный массив.

Имена должны происходить от Reference поле AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Имена генов, указанных как символьный вектор, строка, строковый вектор, клеточный массив символьных векторов или категориальный массив.

Имена должны происходить от Gene поле AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Имена транскриптов, указанных как символьный вектор, строка, строковый вектор, клеточный массив символьных векторов или категориальный массив.

Имена должны происходить от Transcript поле AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Выходные аргументы

развернуть все

Гены, на которые ссылаются экзоны в AnnotObj, возвращено в виде таблицы. Таблица содержит следующие переменные для каждого гена.

Имя переменнойОписание
GeneIDКлеточный массив символьных векторов, содержащих идентификаторы генов, как указано в AnnotObj, полученные из Gene поле AnnotObj.
GeneNameКлеточный массив векторов символов, содержащих имена генов, полученные из Attributes поле AnnotObj. Этот клеточный массив может содержать пустые символьные векторы, если соответствующие имена генов не найдены в Attributes.
ReferenceКатегориальный массив, представляющий названия эталонных последовательностей, к которым принадлежат гены, полученные из Reference поле AnnotObj.
StartНачало расположения первого экзона в каждом гене.
StopОстановите расположение последнего экзона в каждом гене.
StrandКатегориальный массив, содержащий цепь каждого гена.
NumTranscriptsЦелочисленный массив, перечисляющий количество транскриптов в каждом гене.

Примеры

развернуть все

Создайте объект GTFAnnotation из файла в формате GTF.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получить уникальные имена ссылок. В этом случае существует только одна эталонная последовательность, которая является хромосомой 2 (chr2).

ref = getReferenceNames(obj)
ref = 1x1 cell array
    {'chr2'}

Получить таблицу всех генов, которые принадлежат chr2.

genes = getGenes(obj,'Reference',ref)
genes=28×7 table
        GeneID         GeneName     Reference    Start      Stop     Strand    NumTranscripts
    ______________    __________    _________    ______    ______    ______    ______________

    {'uc010yim.1'}    {0x0 char}      chr2        41609     46385      -             1       
    {'uc002qvu.2'}    {0x0 char}      chr2       218138    249852      -             1       
    {'uc002qvv.2'}    {0x0 char}      chr2       218138    256690      -             1       
    {'uc002qvw.2'}    {0x0 char}      chr2       218138    260702      -             1       
    {'uc002qvx.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvy.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvz.2'}    {0x0 char}      chr2       218138    264392      -             1       
    {'uc002qwa.2'}    {0x0 char}      chr2       218138    264743      -             1       
    {'uc010ewe.2'}    {0x0 char}      chr2       218138    264810      -             1       
    {'uc002qwb.2'}    {0x0 char}      chr2       239563    242178      -             1       
    {'uc002qwc.1'}    {0x0 char}      chr2       243503    262786      -             1       
    {'uc002qwd.2'}    {0x0 char}      chr2       264869    272481      +             1       
    {'uc002qwe.3'}    {0x0 char}      chr2       264869    273148      +             1       
    {'uc002qwg.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwh.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwf.2'}    {0x0 char}      chr2       264869    278280      +             1       
      ⋮