getSubset

Класс: GTFAnotation

Создайте объект, содержащий подмножество элементов из GTFAnnotation объект

Синтаксис

NewObj = getSubset(AnnotObj,StartPos,EndPos)
NewObj = getSubset(AnnotObj,Subset)
NewObj = getSubset(___,Name,Value)

Описание

NewObj = getSubset(AnnotObj,StartPos,EndPos) возвращает NewObj, новый объект, содержащий подмножество элементов из AnnotObj который входит в каждую область значений эталонной последовательности, заданный как StartPos и EndPos.

NewObj = getSubset(AnnotObj,Subset) возвращает NewObj, новый объект, содержащий подмножество элементов, заданных Subset, вектор из целых чисел.

NewObj = getSubset(___,Name,Value) возвращает NewObj, новый объект, содержащий подмножество элементов из AnnotObj, использование любого из входных параметров из предыдущих синтаксисов и дополнительные опции, заданные одним или несколькими Name,Value аргументы в виде пар.

Входные параметры

AnnotObj

Объект GTFAnnotation класс.

StartPos

Неотрицательное целое число, задающее начало области значений в каждой ссылочной последовательности в AnnotObj. Целое число StartPos должно быть меньше или равно EndPos.

EndPos

Неотрицательное целое число, задающее конец области значений в каждой эталонной последовательности в AnnotObj. Целое число EndPos должно быть больше или равно StartPos.

Subset

Вектор положительных целых чисел, меньше или равный количеству записей в объекте. Используйте векторную Subset для извлечения любого элемента или подмножества объекта.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

'Reference'

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих одну или несколько ссылочных последовательностей в AnnotObj. Только аннотации, область ссылки которых соответствует одному из векторов символов или строк, включены в NewObj.

'Feature'

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих одни или несколько функций в AnnotObj. Только аннотации, область функции которых соответствует одному из векторов символов или строк, включены в NewObj.

'Gene'

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько генов в AnnotObj. Только аннотации, генная область которых соответствует одному из векторов символов или строк, включены в NewObj.

'Transcript'

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих один или несколько транскриптов в AnnotObj. Только аннотации, область расшифровки стенограммы которых соответствует одному из векторов символов или строк, включены в NewObj.

'Overlap'

Минимальное количество базовых позиций, которые аннотация должна перекрывать в области значений, включаемых в NewObj. Это значение может быть любым из следующих:

  • Положительное целое число

  • 'full' - Аннотация должна быть полностью включена в область значений.

  • 'start' - Начальное положение аннотации должно находиться в области значений, который будет включен.

По умолчанию: 1

Выходные аргументы

NewObj

Объект GTFAnnotation класс.

Примеры

Пример 29. Создайте подмножество данных, содержащее только функции CDS из GTF-форматированного файла

Создайте a GTFAnnotation объект с использованием GTF-форматированного файла, который обеспечивается с Bioinformatics Toolbox™.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Создайте подмножество данных, содержащих только функции CDS.

subsetGTF = getSubset(GTFAnnotObj,'Feature','CDS')
subsetGTF = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 92
Пример 30. Получение подмножеств данных из объекта GTFAnotation

Создайте a GTFAnnotation объект с использованием GTF-форматированного файла, который поставляется с Bioinformatics Toolbox.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Извлечение подмножества данных из первого-пятого элементов GTFAnnotObj.

subsetGTF1 = getSubset(GTFAnnotObj,[1:5])

subsetGTF1 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 5

Извлечение только первого, пятого и восьмого элементов GTFAnnotObj.

subsetGTF2 = getSubset(GTFAnnotObj,[1 5 8])

subsetGTF2 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 3

Совет

  • getSubset метод выбирает аннотации из области значений, заданной StartPos и EndPos для каждой опорной последовательности в AnnotObj если вы не используете 'Reference' аргумент пары "имя-значение" для ограничения ссылочных последовательностей.

  • После создания подмножества объекта можно получить доступ к количеству записей, области значений ссылочных последовательностей, охватываемым аннотациями, именам полей и именам ссылок. Для доступа к значениям всех полей создайте структуру данных с помощью getData способ.

Для просмотра документации необходимо авторизоваться на сайте