getExons

Класс: GTFAnotation

Возвращаемая таблица экзонов из GTFAnnotation объект

Описание

exons = getExons(AnnotObj) возвращает exons, таблица существующих экзонов в AnnotObj.

[exons,junctions]= getExons(AnnotObj) также возвращается junctions, таблица сращенных соединений для каждой ссылки, перечисленной в AnnotObj.

[___] = getExons(AnnotObj,'Reference',R) возвращает экзоны, которые относятся к ссылкам (ссылкам ), заданным в R.

[___] = getExons(AnnotObj,'Gene',G) возвращает экзоны, которые относятся к гену (генам), заданным как G.

[___] = getExons(AnnotObj,'Transcript',T) возвращает экзоны, которые относятся к транскрипту (-ам), заданному T.

Входные параметры

расширить все

Аннотация GTF, заданная как GTFAnnotation объект.

Имена ссылочных последовательностей, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Reference область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует его.

Имена генов, заданные как вектор символов, строка, строковый вектор, массив клеток векторов символов или категориальный массив.

Имена должны происходить от Gene область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Имена транскриптов, заданные как вектор символов, строка, строковый вектор, массив ячеек из векторов символов или категориальный массив.

Имена должны происходить от Transcript область AnnotObj. Если имя не существует, функция выдает предупреждение и игнорирует имя.

Выходные аргументы

расширить все

Экзоны в AnnotObj, возвращается как таблица. Таблица содержит следующие переменные для каждого транскрипта.

Имя переменнойОписание
TranscriptМассив ячеек из символьных векторов, содержащий идентификаторы транскриптов, полученный из Transcript область AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий имена экспрессированных генов, полученных из Attributes область AnnotObj. Этот массив ячеек может содержать пустые символьные векторы, если соответствующие имена генов не найдены в Attributes.
GeneIDМассив ячеек из символьных векторов, содержащая экспрессированные идентификаторы генов, полученные из Gene область AnnotObj.
ReferenceКатегориальный массив, представляющий имена ссылки последовательностей, к которым относятся экспрессируемые гены. Имена ссылок взяты из Reference область AnnotObj.
StartНачальное местоположение каждого экзона.
StopОстановите местоположение каждого экзона.
StrandКатегориальный массив, содержащий цепь экспрессируемого гена.

Сращенные соединения для каждой ссылки, возвращенные как таблица. Таблица содержит следующие переменные для каждого соединения.

Имя переменнойОписание
StartНачало расположения каждого соединения.
StopОстановите расположение каждого соединения.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, к которым относятся соединения. Имена ссылок взяты из Reference область AnnotObj.

Примеры

расширить все

Создайте объект GTFAnotation из GTF-форматированного файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите список имен генов, перечисленных в объекте.

gNames = getGeneNames(obj)
gNames = 28x1 cell
    {'uc002qvu.2'}
    {'uc002qvv.2'}
    {'uc002qvw.2'}
    {'uc002qvx.2'}
    {'uc002qvy.2'}
    {'uc002qvz.2'}
    {'uc002qwa.2'}
    {'uc002qwb.2'}
    {'uc002qwc.1'}
    {'uc002qwd.2'}
    {'uc002qwe.3'}
    {'uc002qwf.2'}
    {'uc002qwg.2'}
    {'uc002qwh.2'}
    {'uc002qwi.3'}
    {'uc002qwk.2'}
    {'uc002qwl.2'}
    {'uc002qwm.1'}
    {'uc002qwn.1'}
    {'uc002qwo.1'}
    {'uc002qwp.2'}
    {'uc002qwq.2'}
    {'uc010ewe.2'}
    {'uc010ewf.1'}
    {'uc010ewg.2'}
    {'uc010ewh.1'}
    {'uc010ewi.2'}
    {'uc010yim.1'}

Получите таблицу экзонов, которые относятся к первому гену uc002qvu.2.

exons = getExons(obj,'Gene',gNames{1})
exons=8×7 table
      Transcript       GeneName         GeneID        Reference    Start      Stop     Strand
    ______________    __________    ______________    _________    ______    ______    ______

    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       218138    219001      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       224864    224920      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       229966    230044      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       231023    231191      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       233101    233229      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       234160    234272      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       247538    247602      -   
    {'uc002qvu.2'}    {0x0 char}    {'uc002qvu.2'}      chr2       249731    249852      -