getSegments

Класс: GTFAnnotation

Возвратите таблицу неперекрывающихся сегментов от объекта GTFAnnotation

Синтаксис

segments = getSegments(AnnotObj)
[segments,transcriptIDs] = getSegments(AnnotObj)
[___] = getSegments(AnnotObj,'Reference',R)
[___] = getSegments(AnnotObj,'Gene',G)
[___] = getSegments(AnnotObj,'Transcript',T)

Описание

segments = getSegments(AnnotObj) возвращает segments, таблицу неперекрывающихся сегментов последовательностей нуклеотида, созданных путем выравнивания расшифровок стенограммы в AnnotObj. Если контур экзона не является тем же самым в двух или больше расшифровках стенограммы гена, то функция создает два или больше неперекрывающихся сегмента, которые покрывают все экзоны в расшифровке стенограммы.

[segments,transcriptIDs] = getSegments(AnnotObj) возвращает transcriptIDs, массив ячеек из символьных векторов, содержащий все уникальные идентификаторы расшифровки стенограммы в AnnotObj.

[___] = getSegments(AnnotObj,'Reference',R) возвращает сегменты, которые принадлежат ссылке (ссылкам), заданной R.

[___] = getSegments(AnnotObj,'Gene',G) возвращает сегменты, которые принадлежат гену (генам), заданному G.

[___] = getSegments(AnnotObj,'Transcript',T) возвращает сегменты, которые принадлежат расшифровке (расшифровкам) стенограммы, заданной T.

Входные параметры

развернуть все

Аннотация GTF, заданная как объект GTFAnnotation.

Имена ссылочных последовательностей, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Reference AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует его.

Имена генов, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Gene AnnotObj. Если имя не существует, функция обеспечивает предупреждение и игнорирует имя.

Имена расшифровок стенограммы, заданных как вектор символов, строка, представляют в виде строки вектор, массив ячеек из символьных векторов или категориальный массив.

Названия должны произойти от поля Transcript AnnotObj. Если имя не существует, функция дает предупреждение и игнорирует имя.

Выходные аргументы

развернуть все

Неперекрывающиеся сегменты, возвращенные как таблица. Таблица содержит следующие переменные для каждого, сегментируется.

Имя переменнойОписание
StartЗапустите местоположение каждого сегмента.
StopОстановите местоположение каждого сегмента.
ReferenceКатегориальный массив, представляющий имена ссылочных последовательностей, которым сегменты принадлежат, полученные из поля Reference AnnotObj.
ExonIndicatorЛогическая разреженная матрица сегмента по сравнению с экзоном. Строки представляют сегменты. Столбцы являются экзонами. Если i th сегмент является частью j th экзон, элемент в положении (i, j) равняется 1. В противном случае это 0.
TranscriptIndicatorЛогическая разреженная матрица сегмента по сравнению с расшифровкой стенограммы. Строки представляют сегменты, и столбцы являются расшифровками стенограммы. Элемент в положении (i, j) равняется 1, если i th сегмент является частью j th расшифровка стенограммы, и 0 в противном случае.

Уникальные идентификаторы расшифровки стенограммы, возвращенные как массив ячеек из символьных векторов. Идентификаторы расшифровки стенограммы соответствуют столбцам переменной TranscriptIndicator segments. Например, первый элемент transcriptIDs является ID первого столбца матрицы TranscriptIndicator.

Примеры

развернуть все

Создайте объект GTFAnnotation из отформатированного GTF файла.

obj = GTFAnnotation('hum37_2_1M.gtf');

Получите уникальные ссылочные имена. В этом случае существует только одна ссылочная последовательность, которая является хромосомой 2 (chr2).

ref = getReferenceNames(obj)
ref = 1x1 cell array
    {'chr2'}

Получите таблицу всех неперекрывающихся сегментов последовательностей нуклеотида, которые принадлежат chr2.

segments = getSegments(obj,'Reference',ref);