CuffGFFReadOptions

Набор опций для cuffgffread

Описание

A CuffGFFReadOptions объект содержит опции для cuffgffread функция, которая фильтрует и преобразует файлы GFF и GTF [1].

Создание

Описание

пример

cuffgffreadOpt = CuffGFFReadOptions создает CuffGFFReadOptions объект со значениями свойств по умолчанию.

CuffGFFReadOptions требуется пакет поддержки Cufflinks для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.

Примечание

CuffGFFReadOptions поддерживается в Mac и UNIX® только платформы.

cuffgffreadOpt = CuffGFFReadOptions(Name,Value) устанавливает свойства объекта с помощью одного или нескольких аргументов пары "имя-значение". Заключайте каждое имя свойства в кавычки. Для примера, cuffgffreadOpt = CuffGFFReadOptions('DiscardSingleExon',true) отбрасывает транскрипты, охватывающие один экзон.

cuffgffreadOpt = CuffGFFReadOptions(S) задает необязательные параметры с помощью строкового или символьного вектора S.

Входные параметры

расширить все

cuffgffread опции, заданные как строковый или символьный вектор. S должен быть в исходном gffread синтаксис опции (префикс одним или двумя штрихами).

Пример: '-U'

Свойства

расширить все

Флаг для добавления описаний файлов из файлов последовательности в descr атрибут выходной записи GFF, заданный как true или false. Задайте файлы последовательности с помощью SequenceInfo опция.

Пример: true

Типы данных: logical

Флаг для проверки противоположной цепи при проверке на наличие внутрикадровых стоповых кодонов, указанный как true или false.

Пример: true

Типы данных: logical

Флаг для корректировки фазы последовательности кодирования при проверке на наличие в кадре стоповых кодонов, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для кластеризации входных транскриптов в локусы, заданный как true или false. Эта опция аналогична опции Merge свойство, за исключением того, что оно не свернет полностью содержащиеся транскрипты с идентичными интронами.

Пример: false

Типы данных: logical

Флаг для сброса транскриптов без функций кодирующей последовательности (CDS), заданный как true или false.

Пример: true

Типы данных: logical

Флаг для свертки полностью содержащихся транскриптов, которые короче с меньшим количеством интронов, чем контейнер, заданный как true или false. Это свойство применяется только при установке Merge на true.

Пример: true

Типы данных: logical

Флаг для свертки более коротких транскриптов, перекрывающихся, по крайней мере, на 80% с другим единственным транскриптом экзона, заданный как true или false. Это свойство применяется только при установке Merge на true.

Пример: true

Типы данных: logical

Геномная область значений для фильтрации транскриптов, заданный как строковый или символьный вектор. Формат должен быть "[[<strand>]<chr>:]<start>..<end>", где start и end являются геномными положениями, chr является необязательным именем хромосомы или contig и необязательным strand ('+' или '-').

Пример: “+NC_000912.1:4821..7340”

Типы данных: char | string

Флаг для игнорирования транскриптов мРНК, либо не имеющих стартового, либо стопового кодона, либо имеющих в кадре стоповый кодон, заданный как true или false.

Пример: true

Типы данных: logical

Флаг, чтобы игнорировать мультиксонные транскрипты мРНК, которые имеют интрон с неканонической последовательностью сращивания, заданный как true или false. Неканоническая последовательность сращивания - это любая последовательность сращивания, отличная от "GT-AG", "CG-AG", или "AT-AC".

Пример: true

Типы данных: logical

Флаг, чтобы игнорировать транскрипты, охватывающие один экзон, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для игнорирования транскриптов с внутрикадровым стоповым кодоном, заданный как true или false.

Пример: true

Типы данных: logical

Команды должны быть в собственном синтаксисе (с префиксом один или два штриха). Используйте эту опцию для применения недокументированных флагов и флагов без соответствующего MATLAB® свойства.

Когда программа преобразует исходные флаги в свойства MATLAB, она сохраняет все неопознанные флаги в этом свойстве.

Пример: "-E"

Типы данных: char | string

Имя файла для сохранения сращенных последовательностей кодирования в формате FASTA, заданное как строковый или символьный вектор.

Пример: "splicedCoding.FASTA"

Типы данных: char | string

Имя файла для сохранения сращенных экзонов в формате FASTA, заданное как строковый или символьный вектор.

Пример: "splicedExon.FASTA"

Типы данных: char | string

Имя файла для сохранения трансляции белка кодирующих последовательностей в формате FASTA, заданном как строковый или символьный вектор.

Пример: "translated.FASTA"

Типы данных: char | string

Флаг для анализа дополнительных атрибутов только из первого экзона, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для перечисления функций GFF самого низкого уровня в качестве признаков экзона в файле выхода, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для сброса транскриптов, не содержащихся полностью в области значений, указанный как true или false. Задайте область значений используя CoordinateRange опция.

Пример: true

Типы данных: logical

Флаг для вывода файлов транскрипта GTF-формата, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для включения всех свойств объекта с соответствующими значениями по умолчанию при преобразовании в синтаксис исходных опций, заданный как true или false. Можно преобразовать свойства в исходный синтаксис, префиксированный одним или двумя штрихами (такими как '-d 100 -e 80') при помощи getCommand. Значение по умолчанию false означает, что, когда вы вызываете getCommand(optionsObject)преобразует только указанные свойства. Если значение true, getCommand преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств в исходный синтаксис.

Примечание

Если вы задаете IncludeAll на trueпрограммное обеспечение преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что когда значение по умолчанию свойства NaN, Inf, [], '', или "", тогда программное обеспечение не преобразует соответствующее свойство.

Пример: true

Типы данных: logical

Максимальная длина интрона для включения транскрипта в файл выхода, заданная как положительное целое число. Inf, значение по умолчанию, не устанавливает предела на длину интрона.

Пример: 500

Типы данных: double

Флаг для слияния транскриптов в локусы путем свертывания транскриптов с идентичными интронами, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для объединения экзонов в один экзон при разделении менее чем 4 интронами с базовой парой, заданный как true или false.

Пример: true

Типы данных: logical

Имя файла для сохранения информации о дубликатах при слиянии, заданное как строковый или символьный вектор. Это свойство применяется только при установке Merge на true.

Пример: "duplicates.txt"

Типы данных: char | string

Флаг для сохранения всех атрибутов в файле выхода, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для фильтрации записей, содержащих слово «pseudo», заданный как true или false.

Пример: false

Типы данных: logical

Имя файла, содержащего таблицу замещения, заданное как строковый или символьный вектор. Таблица должна иметь два столбца, где в первом столбце содержатся исходные идентификаторы транскриптов, а во втором - новые идентификаторы транскриптов. Ниже приведена таблица примеров.

origTranscript1

newTranscript1

origTranscript2

newTranscript2

origTranscript3

newTranscript3

Если вы предоставляете таблицу замещения, функция заменяет идентификаторы транскриптов, найденные в первом столбце, новыми идентификаторами транскриптов из второго столбца и отфильтровывает эти транскрипты, не найденные.

Пример: "replaceTbl.txt"

Типы данных: char | string

Имя файла FASTA-формата, содержащего геномные последовательности для всех входных отображений, заданное как строковый или символьный вектор.

Пример: "seqs.fasta"

Типы данных: char | string

Имя файла с разделителем табуляцией с дополнительной информацией о каждой входной последовательности, заданное как строковый или символьный вектор. Этот файл должен иметь три столбца: столбец с именем последовательности, столбец с длиной последовательности и столбец с описанием последовательности. Если AppendDescription является trueописание последовательности включено в качестве атрибута в выходной файл GFF.

Пример: "seqinfo.txt"

Типы данных: char | string

Флаг для декодирования кодированных URL символов в именах атрибутов, заданный как true или false. Например, «транскрипт% 20description» декодируется на «описание транскрипта».

Пример: true

Типы данных: logical

Флаг для использования метода преобразования GTF-to-GFF3 из Ensembl, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для включения нетранскриптных записей GFF в файл выхода, заданный как true или false.

Пример: true

Типы данных: logical

Флаг для использования имени дорожки во втором столбце выходной линии GFF, заданный как true или false.

Пример: true

Типы данных: logical

Это свойство доступно только для чтения.

Поддерживаемая версия программного обеспечения оригинальных запонок, возвращенная как строка.

Пример: "2.2.1"

Типы данных: string

Флаг для записи координат экзона, проецируемых на сращенную последовательность, заданный как true или false. Это свойство применяется только тогда, когда FastaExonsFile или FastaCDSFile задан.

Пример: true

Типы данных: logical

Функции объекта

getCommandПереведите свойства объекта в синтаксис исходных опций
getOptionsTableВозвращает таблицу со всеми свойствами и эквивалентными опциями в исходном синтаксисе

Примеры

свернуть все

Создайте CuffGFFReadOptions объект со значениями по умолчанию.

opt = CuffGFFReadOptions;

Создайте объект с помощью пар "имя-значение".

opt2 = CuffGFFReadOptions('DiscardSingleExon',true,'FastaExonsFile','exons.fa');

Создайте объект с помощью исходного синтаксиса.

opt3 = CuffGFFReadOptions('-U -w exons.fa')

Преобразуйте файл GTF в файл GFF с сохранением всех атрибутов.

cuffgffread('gyrAB.gtf','gyrABOut.gff','PreserveAttributes',true)

Можно также задать опции с помощью объекта. Для образца укажите выход в формате GTF.

opt = CuffGFFReadOptions;
opt.GTFOutput = true;
opt.PreserveAttributes = true;
cuffgffread('gyrAB.gtf','gyrABOut.gtf',opt);

Если у вас есть объект options, можно извлечь эквивалентные исходные опции для всех свойств объекта, используя getOptionsTable.

getOptionsTable(opt)
ans =

  33×3 table

                                        PropertyName                FlagName        FlagShortName
                                 ___________________________    ________________    _____________

    AppendDescription            'AppendDescription'            '-A'                    ''       
    CheckOppositeStrand          'CheckOppositeStrand'          '-B'                    ''       
    CheckPhase                   'CheckPhase'                   '-H'                    ''       
    Cluster                      'Cluster'                      '--cluster-only'        ''       
    CodingOnly                   'CodingOnly'                   '-C'                    ''       
    CollapseContainer            'CollapseContainer'            '-K'                    ''       
    CollapseFull                 'CollapseFull'                 '-Q'                    ''       
    CoordinateRange              'CoordinateRange'              '-r'                    ''       
    DiscardInvalidCDS            'DiscardInvalidCDS'            '-J'                    ''       
    DiscardNonCanonicalSplice    'DiscardNonCanonicalSplice'    '-N'                    ''       
    DiscardSingleExon            'DiscardSingleExon'            '-U'                    ''       
    DiscardTerminatedCDS         'DiscardTerminatedCDS'         '-V'                    ''       
    FastaCDSFile                 'FastaCDSFile'                 '-x'                    ''       
    FastaExonsFile               'FastaExonsFile'               '-w'                    ''       
    FastaProteinFile             'FastaProteinFile'             '-y'                    ''       
    FirstExonOnly                'FirstExonOnly'                '-G'                    ''       
    ForceExons                   'ForceExons'                   '--force-exons'         ''       
    FullyContained               'FullyContained'               '-R'                    ''       
    GTFOutput                    'GTFOutput'                    '-T'                    ''       
    MaxIntronLength              'MaxIntronLength'              '-i'                    ''       
    Merge                        'Merge'                        '--merge'               '-M'     
    MergeCloseExons              'MergeCloseExons'              '-Z'                    ''       
    MergeInfoFile                'MergeInfoFile'                '-d'                    ''       
    PreserveAttributes           'PreserveAttributes'           '-F'                    ''       
    Pseudo                       'Pseudo'                       '--no-pseudo'           ''       
    ReplacementTable             'ReplacementTable'             '-m'                    ''       
    SequenceFile                 'SequenceFile'                 '-g'                    ''       
    SequenceInfo                 'SequenceInfo'                 '-s'                    ''       
    UrlDecode                    'UrlDecode'                    '-D'                    ''       
    UseEnsemblConversion         'UseEnsemblConversion'         '-L'                    ''       
    UseNonTranscript             'UseNonTranscript'             '-O'                    ''       
    UseTrackName                 'UseTrackName'                 '-t'                    ''       
    WriteCoordinates             'WriteCoordinates'             '-W'                    ''       

Ссылки

[1] Трапнелл, Коул, Брайан А Уильямс, Гео Пертея, Али Мортазави, Гордон Кван, Марийке Дж. Ван Барен, Стивен Л Зальцберг, Барбара Дж. Уолд и Лиор Пахтер. «Сборка транскрипта и количественное определение РНК-Seq обнаруживает неаннотированные транскрипты и переключение изоформы во время дифференциации камер». Биотехнология природы 28, № 5 (май 2010): 511-15.

Введенный в R2019a
Для просмотра документации необходимо авторизоваться на сайте