getTranscripts

Класс: GTFAnotation

Возвращаемая таблица уникальных транскриптов в GTFAnnotation объект

Описание

transcriptsTable = getTranscripts(AnnotObj) возвращает transcriptsTable, таблица транскриптов, на которые ссылаются экзоны в AnnotObj.

transcriptsTable = getTranscripts(AnnotObj,'Reference',R) возвращает транскрипт (ы), которые относятся к ссылкам (ссылкам ), заданным R.

transcriptsTable = getTranscripts(AnnotObj,'Gene',G) возвращает транскрипт (ы), которые принадлежат гену (ам), заданному G.

transcriptsTable = getTranscripts(AnnotObj,'Transcript',T) возвращает транскрипт (ы), заданный как T.

Входные параметры

расширить все

Аннотация GTF, заданная как GTFAnnotation объект.

Имена ссылочных последовательностей, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Reference область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Имена генов, заданные как вектор символов, строка, строковый вектор, массив клеток векторов символов или категориальный массив.

Имена должны происходить от Gene область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Имена транскриптов, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Transcript область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Выходные аргументы

расширить все

Транскрипты, возвращенные как таблица. Таблица содержит следующие переменные для каждого транскрипта.

Имя переменнойОписание
TranscriptМассив ячеек из символьных векторов, содержащий идентификаторы транскриптов, полученный из Transcript область AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий имена экспрессированных генов, полученных из Attributes область AnnotObj. Этот массив ячеек может содержать пустые символьные векторы, если соответствующие имена генов не найдены в Attributes.
GeneIDМассив ячеек из символьных векторов, содержащая экспрессированные идентификаторы генов, полученные из Gene область AnnotObj.
ReferenceКатегориальный массив, представляющий имена ссылки последовательностей, к которым относятся экспрессируемые гены. Имена ссылок взяты из Reference область AnnotObj.
StartНачните местоположение первого экзона в каждом транскрипте.
StopОстановите местоположение последнего экзона в каждой транскрипции.
StrandКатегориальный массив, содержащий цепь экспрессируемого гена.

Примеры

расширить все

Создайте объект GTFAnotation из GTF-форматированного файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите список имен генов, перечисленных в объекте.

gNames = getGeneNames(obj)
gNames = 28x1 cell
    {'uc002qvu.2'}
    {'uc002qvv.2'}
    {'uc002qvw.2'}
    {'uc002qvx.2'}
    {'uc002qvy.2'}
    {'uc002qvz.2'}
    {'uc002qwa.2'}
    {'uc002qwb.2'}
    {'uc002qwc.1'}
    {'uc002qwd.2'}
    {'uc002qwe.3'}
    {'uc002qwf.2'}
    {'uc002qwg.2'}
    {'uc002qwh.2'}
    {'uc002qwi.3'}
    {'uc002qwk.2'}
    {'uc002qwl.2'}
    {'uc002qwm.1'}
    {'uc002qwn.1'}
    {'uc002qwo.1'}
    {'uc002qwp.2'}
    {'uc002qwq.2'}
    {'uc010ewe.2'}
    {'uc010ewf.1'}
    {'uc010ewg.2'}
    {'uc010ewh.1'}
    {'uc010ewi.2'}
    {'uc010yim.1'}

Получите таблицу транскриптов, которые относятся к первому гену uc002qvu.2.

transcripts = getTranscripts(obj,'Gene',gNames{1})
transcripts=1×7 table
      Transcript       GeneName         GeneID        Reference    Start      Stop     Strand
    ______________    __________    ______________    _________    ______    ______    ______

    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       218138    249852      -