Набор опций для cuffgffread
A CuffGFFReadOptions
объект содержит опции для cuffgffread
функция, которая фильтрует и преобразует файлы GFF и GTF [1].
создает cuffgffreadOpt
= CuffGFFReadOptionsCuffGFFReadOptions
объект со значениями свойств по умолчанию.
CuffGFFReadOptions
требуется пакет поддержки Cufflinks для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.
Примечание
CuffGFFReadOptions
поддерживается в Mac и UNIX® только платформы.
устанавливает свойства объекта с помощью одного или нескольких аргументов пары "имя-значение". Заключайте каждое имя свойства в кавычки. Для примера, cuffgffreadOpt
= CuffGFFReadOptions(Name,Value)cuffgffreadOpt = CuffGFFReadOptions('DiscardSingleExon',true)
отбрасывает транскрипты, охватывающие один экзон.
задает необязательные параметры с помощью строкового или символьного вектора cuffgffreadOpt
= CuffGFFReadOptions(S
)S
.
S
— cuffgffread
опцииcuffgffread
опции, заданные как строковый или символьный вектор. S
должен быть в исходном gffread
синтаксис опции (префикс одним или двумя штрихами).
Пример: '-U'
AppendDescription
- Флаг для добавления описаний файлов к descr
признакfalse
(по умолчанию) | true
Флаг для добавления описаний файлов из файлов последовательности в descr
атрибут выходной записи GFF, заданный как true
или false
. Задайте файлы последовательности с помощью SequenceInfo
опция.
Пример:
true
Типы данных: logical
CheckOppositeStrand
- Флаг для проверки противоположной цепи при проверке на внутрикадровые стоповые кодоныfalse
(по умолчанию) | true
Флаг для проверки противоположной цепи при проверке на наличие внутрикадровых стоповых кодонов, указанный как true
или false
.
Пример:
true
Типы данных: logical
CheckPhase
- Флаг для настройки фазы последовательности кодированияfalse
(по умолчанию) | true
Флаг для корректировки фазы последовательности кодирования при проверке на наличие в кадре стоповых кодонов, заданный как true
или false
.
Пример:
true
Типы данных: logical
Cluster
- Флаг для кластера входных транскриптов в locitrue
(по умолчанию) | false
Флаг для кластеризации входных транскриптов в локусы, заданный как true
или false
. Эта опция аналогична опции Merge
свойство, за исключением того, что оно не свернет полностью содержащиеся транскрипты с идентичными интронами.
Пример:
false
Типы данных: logical
CodingOnly
- Флаг, чтобы отбросить транскрипты без кодирующей последовательностиfalse
(по умолчанию) | true
Флаг для сброса транскриптов без функций кодирующей последовательности (CDS), заданный как true
или false
.
Пример:
true
Типы данных: logical
CollapseContainer
- Флаг для свертывания полносодержащих транскриптовfalse
(по умолчанию) | true
Флаг для свертки полностью содержащихся транскриптов, которые короче с меньшим количеством интронов, чем контейнер, заданный как true
или false
. Это свойство применяется только при установке Merge
на true
.
Пример:
true
Типы данных: logical
CollapseFull
- Флаг, чтобы свернуть более короткие транскрипты, перекрывающиеся, по крайней мере, на 80% с другим экзономfalse
(по умолчанию) | true
Флаг для свертки более коротких транскриптов, перекрывающихся, по крайней мере, на 80% с другим единственным транскриптом экзона, заданный как true
или false
. Это свойство применяется только при установке Merge
на true
.
Пример:
true
Типы данных: logical
CoordinateRange
- Геномная область значений для фильтрации транскриптовГеномная область значений для фильтрации транскриптов, заданный как строковый или символьный вектор. Формат должен быть "[[<strand>]<chr>:]<start>..<end>"
, где start
и end
являются геномными положениями, chr
является необязательным именем хромосомы или contig и необязательным strand
('+'
или '-'
).
Пример:
“+NC_000912.1:4821..7340”
Типы данных: char
| string
DiscardInvalidCDS
- Флаг, чтобы игнорировать транскрипты мРНК, либо не имеющие стартового, либо стопового кодона, либо имеющие в кадре стоповый кодонfalse
(по умолчанию) | true
Флаг для игнорирования транскриптов мРНК, либо не имеющих стартового, либо стопового кодона, либо имеющих в кадре стоповый кодон, заданный как true
или false
.
Пример:
true
Типы данных: logical
DiscardNonCanonicalSplice
- Флаг, чтобы игнорировать мультиксонные транскрипты мРНК, которые имеют интрон с неканонической последовательностью сращиванияfalse
(по умолчанию) | true
Флаг, чтобы игнорировать мультиксонные транскрипты мРНК, которые имеют интрон с неканонической последовательностью сращивания, заданный как true
или false
. Неканоническая последовательность сращивания - это любая последовательность сращивания, отличная от "GT-AG"
, "CG-AG"
, или "AT-AC"
.
Пример:
true
Типы данных: logical
DiscardSingleExon
- Флаг, чтобы игнорировать транскрипты, охватывающие один экзонfalse
(по умолчанию) | true
Флаг, чтобы игнорировать транскрипты, охватывающие один экзон, заданный как true
или false
.
Пример:
true
Типы данных: logical
DiscardTerminatedCDS
- Флаг, чтобы игнорировать транскрипты с внутрикадровым стоповым кодономfalse
(по умолчанию) | true
Флаг для игнорирования транскриптов с внутрикадровым стоповым кодоном, заданный как true
или false
.
Пример:
true
Типы данных: logical
ExtraCommand
- Дополнительные команды""
(по умолчанию) | вектор символов | строкаКоманды должны быть в собственном синтаксисе (с префиксом один или два штриха). Используйте эту опцию для применения недокументированных флагов и флагов без соответствующего MATLAB® свойства.
Когда программа преобразует исходные флаги в свойства MATLAB, она сохраняет все неопознанные флаги в этом свойстве.
Пример: "-E"
Типы данных: char
| string
FastaCDSFile
- Имя файла для сохранения сращенных последовательностей кодированияИмя файла для сохранения сращенных последовательностей кодирования в формате FASTA, заданное как строковый или символьный вектор.
Пример:
"splicedCoding.FASTA"
Типы данных: char
| string
FastaExonsFile
- Имя файла для сохранения сращенных экзоновИмя файла для сохранения сращенных экзонов в формате FASTA, заданное как строковый или символьный вектор.
Пример:
"splicedExon.FASTA"
Типы данных: char
| string
FastaProteinFile
- Имя файла для сохранения трансляции белка кодирующих последовательностейИмя файла для сохранения трансляции белка кодирующих последовательностей в формате FASTA, заданном как строковый или символьный вектор.
Пример:
"translated.FASTA"
Типы данных: char
| string
FirstExonOnly
- Флаг для анализа дополнительных атрибутов только из первого экзонаfalse
(по умолчанию) | true
Флаг для анализа дополнительных атрибутов только из первого экзона, заданный как true
или false
.
Пример: true
Типы данных: logical
ForceExons
- Флаг для перечисления функций GFF самого низкого уровня в качестве признаков экзонаfalse
(по умолчанию) | true
Флаг для перечисления функций GFF самого низкого уровня в качестве признаков экзона в файле выхода, заданный как true
или false
.
Пример:
true
Типы данных: logical
FullyContained
- Флаг, чтобы сбросить транскрипты, не содержащиеся полностьюfalse
(по умолчанию) | true
Флаг для сброса транскриптов, не содержащихся полностью в области значений, указанный как true
или false
. Задайте область значений используя CoordinateRange
опция.
Пример:
true
Типы данных: logical
GTFOutput
- Флаг для вывода файлов транскрипта GTF-форматаfalse
(по умолчанию) | true
Флаг для вывода файлов транскрипта GTF-формата, заданный как true
или false
.
Пример:
true
Типы данных: logical
IncludeAll
- Флаг, чтобы использовать все свойства объектаfalse
(по умолчанию) | true
Флаг для включения всех свойств объекта с соответствующими значениями по умолчанию при преобразовании в синтаксис исходных опций, заданный как true
или false
. Можно преобразовать свойства в исходный синтаксис, префиксированный одним или двумя штрихами (такими как '-d 100 -e 80'
) при помощи getCommand
. Значение по умолчанию false
означает, что, когда вы вызываете getCommand(optionsObject)
преобразует только указанные свойства. Если значение true
, getCommand
преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств в исходный синтаксис.
Примечание
Если вы задаете IncludeAll
на true
программное обеспечение преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что когда значение по умолчанию свойства NaN
, Inf
, []
, ''
, или ""
, тогда программное обеспечение не преобразует соответствующее свойство.
Пример: true
Типы данных: logical
MaxIntronLength
- Максимальная длина интрона для транскрипта, которая должна быть включена в выходInf
(по умолчанию) | положительное целое числоМаксимальная длина интрона для включения транскрипта в файл выхода, заданная как положительное целое число. Inf
, значение по умолчанию, не устанавливает предела на длину интрона.
Пример:
500
Типы данных: double
Merge
- Флаг для слияния транскриптов с локусамиfalse
(по умолчанию) | true
Флаг для слияния транскриптов в локусы путем свертывания транскриптов с идентичными интронами, заданный как true
или false
.
Пример:
true
Типы данных: logical
MergeCloseExons
- Флаг для объединения экзонов в один экзонfalse
(по умолчанию) | true
Флаг для объединения экзонов в один экзон при разделении менее чем 4 интронами с базовой парой, заданный как true
или false
.
Пример:
true
Типы данных: logical
MergeInfoFile
- Имя файла для сохранения информации о дубликатах при слиянииИмя файла для сохранения информации о дубликатах при слиянии, заданное как строковый или символьный вектор. Это свойство применяется только при установке Merge
на true
.
Пример:
"duplicates.txt"
Типы данных: char
| string
PreserveAttributes
- Флаг для сохранения всех атрибутов в выходеfalse
(по умолчанию) | true
Флаг для сохранения всех атрибутов в файле выхода, заданный как true
или false
.
Пример:
true
Типы данных: logical
Pseudo
- Флаг для фильтрации записей, содержащих «pseudo»true
(по умолчанию) | false
Флаг для фильтрации записей, содержащих слово «pseudo», заданный как true
или false
.
Пример:
false
Типы данных: logical
ReplacementTable
- Имя файла, содержащего таблицу замещенияИмя файла, содержащего таблицу замещения, заданное как строковый или символьный вектор. Таблица должна иметь два столбца, где в первом столбце содержатся исходные идентификаторы транскриптов, а во втором - новые идентификаторы транскриптов. Ниже приведена таблица примеров.
origTranscript1 | newTranscript1 |
origTranscript2 | newTranscript2 |
origTranscript3 | newTranscript3 |
Если вы предоставляете таблицу замещения, функция заменяет идентификаторы транскриптов, найденные в первом столбце, новыми идентификаторами транскриптов из второго столбца и отфильтровывает эти транскрипты, не найденные.
Пример:
"replaceTbl.txt"
Типы данных: char
| string
SequenceFile
- Имя файла FASTA-формата, содержащего геномные последовательностиИмя файла FASTA-формата, содержащего геномные последовательности для всех входных отображений, заданное как строковый или символьный вектор.
Пример:
"seqs.fasta"
Типы данных: char
| string
SequenceInfo
- Имя файла с разделителем табуляций с дополнительной информацией о входной последовательностиИмя файла с разделителем табуляцией с дополнительной информацией о каждой входной последовательности, заданное как строковый или символьный вектор. Этот файл должен иметь три столбца: столбец с именем последовательности, столбец с длиной последовательности и столбец с описанием последовательности. Если AppendDescription
является true
описание последовательности включено в качестве атрибута в выходной файл GFF.
Пример:
"seqinfo.txt"
Типы данных: char
| string
UrlDecode
- Флаг для декодирования кодированных URL символов в именах атрибутовfalse
(по умолчанию) | true
Флаг для декодирования кодированных URL символов в именах атрибутов, заданный как true
или false
. Например, «транскрипт% 20description» декодируется на «описание транскрипта».
Пример:
true
Типы данных: logical
UseEnsemblConversion
- Флаг для использования GTF-to-GFF3 преобразования из Ensemblfalse
(по умолчанию) | true
Флаг для использования метода преобразования GTF-to-GFF3 из Ensembl, заданный как true
или false
.
Пример:
true
Типы данных: logical
UseNonTranscript
- Флаг для включения нетранскриптных записей GFF в выходной файлfalse
(по умолчанию) | true
Флаг для включения нетранскриптных записей GFF в файл выхода, заданный как true
или false
.
Пример:
true
Типы данных: logical
UseTrackName
- Флаг для использования имени дорожки во втором столбце выходной линии GFFfalse
(по умолчанию) | true
Флаг для использования имени дорожки во втором столбце выходной линии GFF, заданный как true
или false
.
Пример:
true
Типы данных: logical
Version
- Поддерживаемая версияЭто свойство доступно только для чтения.
Поддерживаемая версия программного обеспечения оригинальных запонок, возвращенная как строка.
Пример: "2.2.1"
Типы данных: string
WriteCoordinates
- Флаг для записи координат экзона, проецируемых на сращенную последовательностьfalse
(по умолчанию) | true
Флаг для записи координат экзона, проецируемых на сращенную последовательность, заданный как true
или false
. Это свойство применяется только тогда, когда FastaExonsFile
или FastaCDSFile
задан.
Пример:
true
Типы данных: logical
getCommand | Переведите свойства объекта в синтаксис исходных опций |
getOptionsTable | Возвращает таблицу со всеми свойствами и эквивалентными опциями в исходном синтаксисе |
Создайте CuffGFFReadOptions
объект со значениями по умолчанию.
opt = CuffGFFReadOptions;
Создайте объект с помощью пар "имя-значение".
opt2 = CuffGFFReadOptions('DiscardSingleExon',true,'FastaExonsFile','exons.fa');
Создайте объект с помощью исходного синтаксиса.
opt3 = CuffGFFReadOptions('-U -w exons.fa')
Преобразуйте файл GTF в файл GFF с сохранением всех атрибутов.
cuffgffread('gyrAB.gtf','gyrABOut.gff','PreserveAttributes',true)
Можно также задать опции с помощью объекта. Для образца укажите выход в формате GTF.
opt = CuffGFFReadOptions; opt.GTFOutput = true; opt.PreserveAttributes = true; cuffgffread('gyrAB.gtf','gyrABOut.gtf',opt);
Если у вас есть объект options, можно извлечь эквивалентные исходные опции для всех свойств объекта, используя getOptionsTable
.
getOptionsTable(opt)
ans = 33×3 table PropertyName FlagName FlagShortName ___________________________ ________________ _____________ AppendDescription 'AppendDescription' '-A' '' CheckOppositeStrand 'CheckOppositeStrand' '-B' '' CheckPhase 'CheckPhase' '-H' '' Cluster 'Cluster' '--cluster-only' '' CodingOnly 'CodingOnly' '-C' '' CollapseContainer 'CollapseContainer' '-K' '' CollapseFull 'CollapseFull' '-Q' '' CoordinateRange 'CoordinateRange' '-r' '' DiscardInvalidCDS 'DiscardInvalidCDS' '-J' '' DiscardNonCanonicalSplice 'DiscardNonCanonicalSplice' '-N' '' DiscardSingleExon 'DiscardSingleExon' '-U' '' DiscardTerminatedCDS 'DiscardTerminatedCDS' '-V' '' FastaCDSFile 'FastaCDSFile' '-x' '' FastaExonsFile 'FastaExonsFile' '-w' '' FastaProteinFile 'FastaProteinFile' '-y' '' FirstExonOnly 'FirstExonOnly' '-G' '' ForceExons 'ForceExons' '--force-exons' '' FullyContained 'FullyContained' '-R' '' GTFOutput 'GTFOutput' '-T' '' MaxIntronLength 'MaxIntronLength' '-i' '' Merge 'Merge' '--merge' '-M' MergeCloseExons 'MergeCloseExons' '-Z' '' MergeInfoFile 'MergeInfoFile' '-d' '' PreserveAttributes 'PreserveAttributes' '-F' '' Pseudo 'Pseudo' '--no-pseudo' '' ReplacementTable 'ReplacementTable' '-m' '' SequenceFile 'SequenceFile' '-g' '' SequenceInfo 'SequenceInfo' '-s' '' UrlDecode 'UrlDecode' '-D' '' UseEnsemblConversion 'UseEnsemblConversion' '-L' '' UseNonTranscript 'UseNonTranscript' '-O' '' UseTrackName 'UseTrackName' '-t' '' WriteCoordinates 'WriteCoordinates' '-W' ''
[1] Трапнелл, Коул, Брайан А Уильямс, Гео Пертея, Али Мортазави, Гордон Кван, Марийке Дж. Ван Барен, Стивен Л Зальцберг, Барбара Дж. Уолд и Лиор Пахтер. «Сборка транскрипта и количественное определение РНК-Seq обнаруживает неаннотированные транскрипты и переключение изоформы во время дифференциации камер». Биотехнология природы 28, № 5 (май 2010): 511-15.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.