getSubset

Класс: GTFAnnotation

Создайте объект, содержащий подмножество элементов от объекта GTFAnnotation

Синтаксис

NewObj = getSubset(AnnotObj,StartPos,EndPos)
NewObj = getSubset(AnnotObj,Subset)
NewObj = getSubset(___,Name,Value)

Описание

NewObj = getSubset(AnnotObj,StartPos,EndPos) возвращает NewObj, новый объект, содержащий подмножество элементов от AnnotObj, который находится в пределах каждой ссылочной области значений последовательности, заданной StartPos и EndPos.

NewObj = getSubset(AnnotObj,Subset) возвращает NewObj, новый объект, содержащий подмножество элементов, указанных Subset, вектором целых чисел.

NewObj = getSubset(___,Name,Value) возвращает NewObj, новый объект, содержащий подмножество элементов от AnnotObj, с помощью любого из входных параметров от предыдущих синтаксисов и дополнительных опций, заданных одним или несколькими аргументами пары Name,Value.

Входные параметры

AnnotObj

Объект класса GTFAnnotation.

StartPos

Неотрицательное целое число, задающее запуск области значений в каждой ссылочной последовательности в AnnotObj. Целочисленный StartPos должен быть меньше чем или равен EndPos.

EndPos

Неотрицательное целое число, задающее конец области значений в каждой ссылочной последовательности в AnnotObj. Целочисленный EndPos должен быть больше, чем или равным StartPos.

Subset

Вектор положительных целых чисел, меньше чем или равных количеству записей в объекте. Используйте векторный Subset, чтобы получить любой элемент или подмножество объекта.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'Reference'

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько ссылочных последовательностей в AnnotObj. Только аннотации, поле ссылки которых совпадает с одним из векторов символов или строк, включены в NewObj.

'Feature'

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько функций в AnnotObj. Только аннотации, поле функции которых совпадает с одним из векторов символов или строк, включены в NewObj.

'Gene'

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий один или несколько генов в AnnotObj. Только аннотации, генное поле которых совпадает с одним из векторов символов или строк, включены в NewObj.

'Transcript'

Вектор символов, строка, представляет в виде строки вектор или массив ячеек из символьных векторов, задающий одну или несколько расшифровок стенограммы в AnnotObj. Только аннотации, поле расшифровки стенограммы которых совпадает с одним из векторов символов или строк, включены в NewObj.

'Overlap'

Минимальное количество основных положений, которые аннотация должна перекрыть в области значений, чтобы быть включенной в NewObj. Это значение может быть любым следующим:

  • Положительное целое число

  • полный Аннотация должна полностью содержаться в области значений, которая будет включена.

  • запуск Положение запуска аннотации должно лечь в области значений, которая будет включена.

Значение по умолчанию: 1

Выходные аргументы

NewObj

Объект класса GTFAnnotation.

Примеры

Пример 40. Создайте подмножество данных, содержащих только функции CDS из отформатированного GTF файла

Создайте объект GTFAnnotation с помощью отформатированного GTF файла, которому предоставляют Bioinformatics Toolbox™.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Создайте подмножество данных, содержащих только функции CDS.

subsetGTF = getSubset(GTFAnnotObj,'Feature','CDS')
subsetGTF = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 92
Пример 41. Получите подмножества данных из объекта GTFAnnotation

Создайте объект GTFAnnotation с помощью отформатированного GTF файла, которому предоставляют Bioinformatics Toolbox.

GTFAnnotObj = GTFAnnotation('hum37_2_1M.gtf');

Получите подмножество данных сначала к пятым элементам GTFAnnotObj.

subsetGTF1 = getSubset(GTFAnnotObj,[1:5])

subsetGTF1 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 5

Получите только первые, пятые и восьмые элементы GTFAnnotObj.

subsetGTF2 = getSubset(GTFAnnotObj,[1 5 8])

subsetGTF2 = 

  GTFAnnotation with properties:

    FieldNames: {1x11 cell}
    NumEntries: 3

Советы

  • Метод getSubset выбирает аннотации из области значений, заданной StartPos и EndPos для каждой ссылочной последовательности в AnnotObj, если вы не используете аргумент пары "имя-значение" 'Reference', чтобы ограничить ссылочные последовательности.

  • После создания объекта из подмножества можно получить доступ к количеству записей, области значений ссылочных последовательностей, охваченных аннотациями, именами полей и ссылочными именами. Чтобы получить доступ к значениям всех полей, создайте структуру данных с помощью метода GTFAnnotation.getData.