getGenes

Класс: GTFAnotation

Таблица возвращений уникальных генов в GTFAnnotation объект

Описание

genes = getGenes(AnnotObj) возвращает genes, таблица генов, на которые ссылаются экзоны в AnnotObj.

genes = getGenes(AnnotObj,'Reference',R) возвращает ген (ы), которые относятся к ссылкам (ссылкам ), заданным R.

genes = getGenes(AnnotObj,'Gene',G) возвращает ген (ы), заданный как G.

genes = getGenes(AnnotObj,'Transcript',T) возвращает ген (ы), который содержит транскрипт (ы), заданный T.

Входные параметры

расширить все

Аннотация GTF, заданная как GTFAnnotation объект.

Имена ссылочных последовательностей, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Reference область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Имена генов, заданные как вектор символов, строка, строковый вектор, массив клеток векторов символов или категориальный массив.

Имена должны происходить от Gene область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Имена транскриптов, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Transcript область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Выходные аргументы

расширить все

Гены, на которые ссылаются экзоны в AnnotObj, возвращается как таблица. Таблица содержит следующие переменные для каждого гена.

Имя переменнойОписание
GeneIDМассивы ячеек из символьных векторов, содержащие идентификаторы генов, перечисленные в AnnotObj, полученный из Gene область AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащая имена генов, полученные из Attributes область AnnotObj. Этот массив ячеек может содержать пустые символьные векторы, если соответствующие имена генов не найдены в Attributes.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, к которым относятся гены, полученный из Reference область AnnotObj.
StartНачало расположения первого экзона в каждом гене.
StopОстановите расположение последнего экзона в каждом гене.
StrandКатегориальный массив, содержащий цепь каждого гена.
NumTranscriptsЦелочисленный массив с указанием количества транскриптов в каждом гене.

Примеры

расширить все

Создайте объект GTFAnotation из GTF-форматированного файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получение уникальных имен ссылок. В этом случае существует только одна эталонная последовательность, которая является хромосомой 2 (chr2).

ref = getReferenceNames(obj)
ref = 1x1 cell array
    {'chr2'}

Получите таблицу всех генов, которые относятся к chr2.

genes = getGenes(obj,'Reference',ref)
genes=28×7 table
        GeneID         GeneName     Reference    Start      Stop     Strand    NumTranscripts
    ______________    __________    _________    ______    ______    ______    ______________

    {'uc010yim.1'}    {0x0 char}      chr2        41609     46385      -             1       
    {'uc002qvu.2'}    {0x0 char}      chr2       218138    249852      -             1       
    {'uc002qvv.2'}    {0x0 char}      chr2       218138    256690      -             1       
    {'uc002qvw.2'}    {0x0 char}      chr2       218138    260702      -             1       
    {'uc002qvx.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvy.2'}    {0x0 char}      chr2       218138    264068      -             1       
    {'uc002qvz.2'}    {0x0 char}      chr2       218138    264392      -             1       
    {'uc002qwa.2'}    {0x0 char}      chr2       218138    264743      -             1       
    {'uc010ewe.2'}    {0x0 char}      chr2       218138    264810      -             1       
    {'uc002qwb.2'}    {0x0 char}      chr2       239563    242178      -             1       
    {'uc002qwc.1'}    {0x0 char}      chr2       243503    262786      -             1       
    {'uc002qwd.2'}    {0x0 char}      chr2       264869    272481      +             1       
    {'uc002qwe.3'}    {0x0 char}      chr2       264869    273148      +             1       
    {'uc002qwg.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwh.2'}    {0x0 char}      chr2       264869    278280      +             1       
    {'uc002qwf.2'}    {0x0 char}      chr2       264869    278280      +             1       
      ⋮