exponenta event banner

getSubset

Класс: GTFAnnotation

Создать объект, содержащий подмножество элементов из GTFAnnotation объект

Синтаксис

NewObj = getSubset(AnnotObj,StartPos,EndPos)
NewObj = getSubset(AnnotObj,Subset)
NewObj = getSubset(___,Name,Value)

Описание

NewObj = getSubset(AnnotObj,StartPos,EndPos) прибыль NewObj, новый объект, содержащий подмножество элементов из AnnotObj который попадает в каждый диапазон ссылочной последовательности, указанный StartPos и EndPos.

NewObj = getSubset(AnnotObj,Subset) прибыль NewObj, новый объект, содержащий подмножество элементов, указанных Subset, вектор целых чисел.

NewObj = getSubset(___,Name,Value) прибыль NewObj, новый объект, содержащий подмножество элементов из AnnotObj, используя любой из входных аргументов из предыдущих синтаксисов и дополнительных параметров, заданных одним или несколькими Name,Value аргументы пары.

Входные аргументы

AnnotObj

Объект GTFAnnotation класс.

StartPos

Неотрицательное целое число, указывающее начало диапазона в каждой ссылочной последовательности в AnnotObj. Целое число StartPos должно быть меньше или равно EndPos.

EndPos

Неотрицательное целое число, указывающее конец диапазона в каждой ссылочной последовательности в AnnotObj. Целое число EndPos должно быть больше или равно StartPos.

Subset

Вектор положительных целых чисел, меньших или равных количеству записей в объекте. Использовать вектор Subset для извлечения любого элемента или подмножества объекта.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'Reference'

Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих одну или несколько опорных последовательностей в AnnotObj. Только аннотации, ссылочное поле которых совпадает с одним из векторов символов или строк, включаются в NewObj.

'Feature'

Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих один или несколько элементов в AnnotObj. Только аннотации, поле элемента которых соответствует одному из векторов символов или строк, включаются в NewObj.

'Gene'

Символьный вектор, строка, строковый вектор или клеточный массив символьных векторов, задающих один или несколько генов в AnnotObj. Только аннотации, поле гена которых соответствует одному из векторов символов или строк, включены в NewObj.

'Transcript'

Символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, задающих один или несколько транскриптов в AnnotObj. Только аннотации, поле транскрипта которых совпадает с одним из векторов символов или строк, включаются в NewObj.

'Overlap'

Минимальное количество базовых позиций, которые аннотация должна перекрывать в диапазоне для включения в NewObj. Это значение может быть любым из следующих:

  • Положительное целое число

  • 'full' - Аннотация должна полностью содержаться в диапазоне, который будет включен.

  • 'start' - Начальное положение аннотации должно находиться в пределах диапазона, который необходимо включить.

По умолчанию: 1

Выходные аргументы

NewObj

Объект GTFAnnotation класс.

Примеры

Пример 29. Создание подмножества данных, содержащих только элементы CDS, из файла в формате GTF

Построить GTFAnnotation с использованием файла в формате GTF, поставляемого с Toolbox™ биоинформатики.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Создайте подмножество данных, содержащее только элементы CDS.

subsetGTF = getSubset(GTFAnnotObj,'Feature','CDS')
subsetGTF = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 92
Пример 30. Извлечение подмножеств данных из объекта GTFAnnotation

Построить GTFAnnotation с использованием файла в формате GTF, поставляемого с панелью инструментов биоинформатики.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Извлечение подмножества данных из первого-пятого элементов GTFAnnotObj.

subsetGTF1 = getSubset(GTFAnnotObj,[1:5])

subsetGTF1 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 5

Извлекать только первый, пятый и восьмой элементы GTFAnnotObj.

subsetGTF2 = getSubset(GTFAnnotObj,[1 5 8])

subsetGTF2 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 3

Совет

  • getSubset метод выбирает аннотации из диапазона, заданного StartPos и EndPos для каждой ссылочной последовательности в AnnotObj если вы не используете 'Reference' аргумент пары имя-значение для ограничения ссылочных последовательностей.

  • После создания поднабора объектов можно получить доступ к количеству записей, диапазону последовательностей ссылок, охватываемых аннотациями, именами полей и именами ссылок. Для доступа ко значениям всех полей создайте структуру данных с помощью getData способ.