getSubset

Класс: GTFAnnotation

Создайте объект, содержащий подмножество элементов от GTFAnnotation объект

Синтаксис

NewObj = getSubset(AnnotObj,StartPos,EndPos)
NewObj = getSubset(AnnotObj,Subset)
NewObj = getSubset(___,Name,Value)

Описание

NewObj = getSubset(AnnotObj,StartPos,EndPos) возвращает NewObj, новый объект, содержащий подмножество элементов от AnnotObj это находится в пределах каждого ссылочного диапазона последовательности, указанного StartPos и EndPos.

NewObj = getSubset(AnnotObj,Subset) возвращает NewObj, новый объект, содержащий подмножество элементов, задан Subset, вектор из целых чисел.

NewObj = getSubset(___,Name,Value) возвращает NewObj, новый объект, содержащий подмножество элементов от AnnotObj, использование любого из входных параметров от предыдущих синтаксисов и дополнительных опций задано одним или несколькими Name,Value парные аргументы.

Входные параметры

AnnotObj

Объект GTFAnnotation класс.

StartPos

Неотрицательное целое число, задающее запуск области значений в каждой ссылочной последовательности в AnnotObj. Целочисленный StartPos должно быть меньше чем или равно EndPos.

EndPos

Неотрицательное целое число, задающее конец области значений в каждой ссылочной последовательности в AnnotObj. Целочисленный EndPos должен быть больше или быть равен StartPos.

Subset

Вектор из положительных целых чисел, меньше чем или равных количеству записей в объекте. Используйте векторный Subset получать любой элемент или подмножество объекта.

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Reference

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько ссылочных последовательностей в AnnotObj. Только аннотации, поле ссылки которых совпадает с одним из векторов символов или строк, включены в NewObj.

Feature

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько функций в AnnotObj. Только аннотации, поле функции которых совпадает с одним из векторов символов или строк, включены в NewObj.

Gene

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий один или несколько генов в AnnotObj. Только аннотации, генное поле которых совпадает с одним из векторов символов или строк, включены в NewObj.

Transcript

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько расшифровок стенограммы в AnnotObj. Только аннотации, поле расшифровки стенограммы которых совпадает с одним из векторов символов или строк, включены в NewObj.

Overlap

Минимальное количество основных положений, которые аннотация должна перекрыть в области значений, чтобы быть включенной в NewObj. Это значение может быть любым следующим:

  • Положительное целое число

  • 'full' — Аннотация должна полностью содержаться в области значений, которая будет включена.

  • 'start' — Положение запуска аннотации должно лечь в области значений, которая будет включена.

Значение по умолчанию: 1

Выходные аргументы

NewObj

Объект GTFAnnotation класс.

Примеры

Пример 27. Создайте подмножество данных, содержащих только функции CDS из отформатированного GTF файла

Создайте a GTFAnnotation объект с помощью отформатированного GTF файла, которому предоставляют Bioinformatics Toolbox™.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Создайте подмножество данных, содержащих только функции CDS.

subsetGTF = getSubset(GTFAnnotObj,'Feature','CDS')
subsetGTF = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 92
Пример 28. Получите подмножества данных из объекта GTFAnnotation

Создайте a GTFAnnotation объект с помощью отформатированного GTF файла, которому предоставляют Bioinformatics Toolbox.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Получите подмножество данных сначала к пятым элементам GTFAnnotObj.

subsetGTF1 = getSubset(GTFAnnotObj,[1:5])

subsetGTF1 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 5

Получите только первые, пятые и восьмые элементы GTFAnnotObj.

subsetGTF2 = getSubset(GTFAnnotObj,[1 5 8])

subsetGTF2 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 3

Советы

  • getSubset метод выбирает аннотации из диапазона, указанного StartPos и EndPos для каждой ссылочной последовательности в AnnotObj если вы не используете 'Reference' аргумент пары "имя-значение", чтобы ограничить ссылочные последовательности.

  • После создания объекта из подмножества можно получить доступ к количеству записей, области значений ссылочных последовательностей, охваченных аннотациями, именами полей и ссылочными именами. Чтобы получить доступ к значениям всех полей, создайте структуру данных с помощью getData метод.