getExons

Класс: GTFAnnotation

Возвратите таблицу экзонов от объекта GTFAnnotation

Синтаксис

exons = getExons(AnnotObj)
[exons,junctions]= getExons(AnnotObj)
[___] = getExons(AnnotObj,'Reference',R)
[___] = getExons(AnnotObj,'Gene',G)
[___] = getExons(AnnotObj,'Transcript',T)

Описание

exons = getExons(AnnotObj) возвращает exons, таблицу существующих экзонов в AnnotObj.

[exons,junctions]= getExons(AnnotObj) также возвращает junctions, таблицу соединенных соединений для каждой ссылки, перечисленной в AnnotObj.

[___] = getExons(AnnotObj,'Reference',R) возвращает экзоны, которые принадлежат ссылке (ссылкам), заданной R.

[___] = getExons(AnnotObj,'Gene',G) возвращает экзоны, которые принадлежат гену (генам), заданному G.

[___] = getExons(AnnotObj,'Transcript',T) возвращает экзоны, которые принадлежат расшифровке (расшифровкам) стенограммы, заданной T.

Входные параметры

развернуть все

Аннотация GTF, заданная как объект GTFAnnotation.

Имена ссылочных последовательностей, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Reference AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует его.

Имена генов, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Gene AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует имя.

Имена расшифровок стенограммы, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Transcript AnnotObj. Если имя не существует, функция дает предупреждение и игнорирует имя.

Выходные аргументы

развернуть все

Экзоны в AnnotObj, возвращенном как таблица. Таблица содержит следующие переменные для каждой расшифровки стенограммы.

Имя переменнойОписание
TranscriptМассив ячеек из символьных векторов, содержащий идентификаторы расшифровки стенограммы, полученные из поля Transcript AnnotObj.
GeneNameМассив ячеек из символьных векторов, содержащий имена выраженных генов, полученных из поля Attributes AnnotObj. Этот массив ячеек может содержать пустые символьные вектора, если соответствующие названия генов не найдены в Attributes.
GeneIDМассив ячеек из символьных векторов, содержащий выраженные генные идентификаторы, полученные из поля Gene AnnotObj.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым принадлежат выраженные гены. Ссылочные имена от поля Reference AnnotObj.
StartЗапустите местоположение каждого экзона.
StopОстановите местоположение каждого экзона.
StrandКатегориальный массив, содержащий скрутку выраженного гена.

Соединенные соединения для каждой ссылки, возвращенной как таблица. Таблица содержит следующие переменные для каждого соединения.

Имя переменнойОписание
StartЗапустите местоположение каждого соединения.
StopОстановите местоположение каждого соединения.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым принадлежат соединения. Ссылочные имена от поля Reference AnnotObj.

Примеры

развернуть все

Создайте объект GTFAnnotation из отформатированного GTF файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите список названий генов, перечисленных в объекте.

gNames = getGeneNames(obj)
gNames = 28x1 cell array
    {'uc002qvu.2'}
    {'uc002qvv.2'}
    {'uc002qvw.2'}
    {'uc002qvx.2'}
    {'uc002qvy.2'}
    {'uc002qvz.2'}
    {'uc002qwa.2'}
    {'uc002qwb.2'}
    {'uc002qwc.1'}
    {'uc002qwd.2'}
    {'uc002qwe.3'}
    {'uc002qwf.2'}
    {'uc002qwg.2'}
    {'uc002qwh.2'}
    {'uc002qwi.3'}
    {'uc002qwk.2'}
    {'uc002qwl.2'}
    {'uc002qwm.1'}
    {'uc002qwn.1'}
    {'uc002qwo.1'}
    {'uc002qwp.2'}
    {'uc002qwq.2'}
    {'uc010ewe.2'}
    {'uc010ewf.1'}
    {'uc010ewg.2'}
    {'uc010ewh.1'}
    {'uc010ewi.2'}
    {'uc010yim.1'}

Получите таблицу экзонов, которые принадлежат первому гену uc002qvu.2.

exons = getExons(obj,'Gene',gNames{1})
exons=8×7 table
     Transcript     GeneName       GeneID       Reference    Start      Stop     Strand
    ____________    ________    ____________    _________    ______    ______    ______

    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       218138    219001      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       224864    224920      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       229966    230044      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       231023    231191      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       233101    233229      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       234160    234272      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       247538    247602      -   
    'uc002qvu.2'       ''       'uc002qvu.2'      chr2       249731    249852      -