getTranscripts

Класс: GTFAnnotation

Возвратите таблицу уникальных расшифровок стенограммы в GTFAnnotation объект

Описание

transcriptsTable = getTranscripts(AnnotObj) возвращает transcriptsTable, на таблицу расшифровок стенограммы ссылаются экзоны в AnnotObj.

transcriptsTable = getTranscripts(AnnotObj,'Reference',R) возвращает расшифровку (расшифровки) стенограммы, которые принадлежат ссылке (ссылкам), заданной R.

transcriptsTable = getTranscripts(AnnotObj,'Gene',G) возвращает расшифровку (расшифровки) стенограммы, которые принадлежат гену (генам), заданному G.

transcriptsTable = getTranscripts(AnnotObj,'Transcript',T) возвращает расшифровку (расшифровки) стенограммы, заданную T.

Входные параметры

развернуть все

Аннотация GTF в виде GTFAnnotation объект.

Имена ссылочных последовательностей в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Reference поле AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует его.

Имена генов в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Gene поле AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует имя.

Имена расшифровок стенограммы в виде вектора символов, строки, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от Transcript поле AnnotObj. Если имя не существует, функция дает предупреждение и игнорирует имя.

Выходные аргументы

развернуть все

Расшифровки стенограммы, возвращенные как таблица. Таблица содержит следующие переменные для каждой расшифровки стенограммы.

Имя переменнойОписание
TranscriptМассив ячеек из символьных векторов, содержащий идентификаторы расшифровки стенограммы, полученные из Transcript поле AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий имена описанных генов, полученных из Attributes поле AnnotObj. Этот массив ячеек может содержать пустые символьные вектора, если соответствующие названия генов не найдены в Attributes.
GeneIDМассив ячеек из символьных векторов, содержащий описанные генные идентификаторы, полученные из Gene поле AnnotObj.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым принадлежат описанные гены. Ссылочные имена от Reference поле AnnotObj.
StartЗапустите местоположение первого экзона в каждой расшифровке стенограммы.
StopОстановите местоположение последнего экзона в каждой расшифровке стенограммы.
StrandКатегориальный массив, содержащий скрутку описанного гена.

Примеры

развернуть все

Создайте объект GTFAnnotation из отформатированного GTF файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите список названий генов, перечисленных в объекте.

gNames = getGeneNames(obj)
gNames = 28x1 cell
    {'uc002qvu.2'}
    {'uc002qvv.2'}
    {'uc002qvw.2'}
    {'uc002qvx.2'}
    {'uc002qvy.2'}
    {'uc002qvz.2'}
    {'uc002qwa.2'}
    {'uc002qwb.2'}
    {'uc002qwc.1'}
    {'uc002qwd.2'}
    {'uc002qwe.3'}
    {'uc002qwf.2'}
    {'uc002qwg.2'}
    {'uc002qwh.2'}
    {'uc002qwi.3'}
    {'uc002qwk.2'}
    {'uc002qwl.2'}
    {'uc002qwm.1'}
    {'uc002qwn.1'}
    {'uc002qwo.1'}
    {'uc002qwp.2'}
    {'uc002qwq.2'}
    {'uc010ewe.2'}
    {'uc010ewf.1'}
    {'uc010ewg.2'}
    {'uc010ewh.1'}
    {'uc010ewi.2'}
    {'uc010yim.1'}

Получите таблицу расшифровок стенограммы, которые принадлежат первому гену uc002qvu.2.

transcripts = getTranscripts(obj,'Gene',gNames{1})
transcripts=1×7 table
      Transcript       GeneName         GeneID        Reference    Start      Stop     Strand
    ______________    __________    ______________    _________    ______    ______    ______

    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       218138    249852      -