getGenes

Класс: GTFAnnotation

Возвратите таблицу уникальных генов в GTFAnnotation объект

Описание

genes = getGenes(AnnotObj) возвращает genes, на таблицу генов ссылаются экзоны в AnnotObj.

genes = getGenes(AnnotObj,'Reference',R) возвращает ген (гены), которые принадлежат ссылке (ссылкам), заданной R.

genes = getGenes(AnnotObj,'Gene',G) возвращает ген (гены), заданный G.

genes = getGenes(AnnotObj,'Transcript',T) возвращает ген (гены), который содержит расшифровку (расшифровки) стенограммы, заданную T.

Входные параметры

развернуть все

Аннотация GTF в виде GTFAnnotation объект.

Имена ссылочных последовательностей в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Reference поле AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует его.

Имена генов в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Gene поле AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует имя.

Имена расшифровок стенограммы в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Transcript поле AnnotObj. Если имя не существует, функция дает предупреждение и игнорирует имя.

Выходные аргументы

развернуть все

На гены ссылаются экзоны в AnnotObj, возвращенный как таблица. Таблица содержит следующие переменные для каждого гена.

Имя переменнойОписание
GeneIDМассив ячеек из символьных векторов, содержащий генные идентификаторы, как перечислено в AnnotObj, полученный из Gene поле AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий названия генов, полученные из Attributes поле AnnotObj. Этот массив ячеек может содержать пустые символьные вектора, если соответствующие названия генов не найдены в Attributes.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым гены принадлежат, полученные из Reference поле AnnotObj.
StartЗапустите местоположение первого экзона в каждом гене.
StopОстановите местоположение последнего экзона в каждом гене.
StrandКатегориальный массив, содержащий скрутку каждого гена.
NumTranscriptsЦелочисленный массив, перечисляющий количество расшифровок стенограммы в каждом гене.

Примеры

развернуть все

Создайте объект GTFAnnotation из отформатированного GTF файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите уникальные ссылочные имена. В этом случае существует только одна ссылочная последовательность, которая является хромосомой 2 (chr2).

ref = getReferenceNames(obj)
ref = 1x1 cell array
    {'chr2'}

Получите таблицу всех генов, которые принадлежат chr2.

genes = getGenes(obj,'Reference',ref)
genes=28×7 table
        GeneID         GeneName     Reference    Start      Stop     Strand    NumTranscripts
    ______________    __________    _________    ______    ______    ______    ______________

    {'uc010yim.1'}    {0x0 char}      chr2        41609     46385      -             1       
    {'uc002qvu.2'}    {0x0 char}      chr2       218138    249852      -             1       
    {'uc002qvv.2'}    {0x0 char}      chr2       218138    256690      -             1       
    {'uc002qvw.2'}    {0x0 char}      chr2       218138    260702      -             1       
    {'uc002qvx.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvy.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvz.2'}    {0x0 char}      chr2       218138    264392      -             1       
    {'uc002qwa.2'}    {0x0 char}      chr2       218138    264743      -             1       
    {'uc010ewe.2'}    {0x0 char}      chr2       218138    264810      -             1       
    {'uc002qwb.2'}    {0x0 char}      chr2       239563    242178      -             1       
    {'uc002qwc.1'}    {0x0 char}      chr2       243503    262786      -             1       
    {'uc002qwd.2'}    {0x0 char}      chr2       264869    272481      +             1       
    {'uc002qwe.3'}    {0x0 char}      chr2       264869    273148      +             1       
    {'uc002qwg.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwh.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwf.2'}    {0x0 char}      chr2       264869    278280      +             1       
      ⋮