getGenes

Класс: GTFAnnotation

Возвратите таблицу уникальных генов в объекте GTFAnnotation

Синтаксис

genes = getGenes(AnnotObj)
genes = getGenes(AnnotObj,'Reference',R)
genes = getGenes(AnnotObj,'Gene',G)
genes = getGenes(AnnotObj,'Transcript',T)

Описание

genes = getGenes(AnnotObj) возвращает genes, таблицу генов, на которые ссылаются экзоны в AnnotObj.

genes = getGenes(AnnotObj,'Reference',R) возвращает ген (гены), которые принадлежат ссылке (ссылкам), заданной R.

genes = getGenes(AnnotObj,'Gene',G) возвращает ген (гены), заданный G.

genes = getGenes(AnnotObj,'Transcript',T) возвращает ген (гены), который содержит расшифровку (расшифровки) стенограммы, заданную T.

Входные параметры

развернуть все

Аннотация GTF, заданная как объект GTFAnnotation.

Имена ссылочных последовательностей, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Reference AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует его.

Имена генов, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Gene AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует имя.

Имена расшифровок стенограммы, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Transcript AnnotObj. Если имя не существует, функция дает предупреждение и игнорирует имя.

Выходные аргументы

развернуть все

Гены, на которые ссылаются экзоны в AnnotObj, возвращенном как таблица. Таблица содержит следующие переменные для каждого гена.

Имя переменнойОписание
GeneIDМассив ячеек из символьных векторов, содержащий генные идентификаторы, как перечислено в AnnotObj, полученном из поля Gene AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий названия генов, полученные из поля Attributes AnnotObj. Этот массив ячеек может содержать пустые символьные вектора, если соответствующие названия генов не найдены в Attributes.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым гены принадлежат, полученные из поля Reference AnnotObj.
StartЗапустите местоположение первого экзона в каждом гене.
StopОстановите местоположение последнего экзона в каждом гене.
StrandКатегориальный массив, содержащий скрутку каждого гена.
NumTranscriptsЦелочисленный массив, перечисляющий количество расшифровок стенограммы в каждом гене.

Примеры

развернуть все

Создайте объект GTFAnnotation из отформатированного GTF файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите уникальные ссылочные имена. В этом случае существует только одна ссылочная последовательность, которая является хромосомой 2 (chr2).

ref = getReferenceNames(obj)
ref = 1x1 cell array
    {'chr2'}

Получите таблицу всех генов, которые принадлежат chr2.

genes = getGenes(obj,'Reference',ref)
genes=28×7 table
       GeneID       GeneName    Reference    Start      Stop     Strand    NumTranscripts
    ____________    ________    _________    ______    ______    ______    ______________

    'uc010yim.1'       ''         chr2        41609     46385      -             1       
    'uc002qvu.2'       ''         chr2       218138    249852      -             1       
    'uc002qvv.2'       ''         chr2       218138    256690      -             1       
    'uc002qvw.2'       ''         chr2       218138    260702      -             1       
    'uc002qvx.2'       ''         chr2       218138    264068      -             1       
    'uc002qvy.2'       ''         chr2       218138    264068      -             1       
    'uc002qvz.2'       ''         chr2       218138    264392      -             1       
    'uc002qwa.2'       ''         chr2       218138    264743      -             1       
    'uc010ewe.2'       ''         chr2       218138    264810      -             1       
    'uc002qwb.2'       ''         chr2       239563    242178      -             1       
    'uc002qwc.1'       ''         chr2       243503    262786      -             1       
    'uc002qwd.2'       ''         chr2       264869    272481      +             1       
    'uc002qwe.3'       ''         chr2       264869    273148      +             1       
    'uc002qwg.2'       ''         chr2       264869    278280      +             1       
    'uc002qwh.2'       ''         chr2       264869    278280      +             1       
    'uc002qwf.2'       ''         chr2       264869    278280      +             1       
      ⋮