Отфильтруйте и преобразуйте файлы GTF и GFF
cuffgffread(
читает input
,output
)input
GFF или файл GTF и записи обязательные столбцы к output
Файл [1] GFF. Функция может также возвратить файл формата GTF с помощью 'GTFOutput'
опция.
cuffgffread
требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.
cuffgffread
поддерживается на Mac и платформах UNIX® только.
cuffgffread(
дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, input
,output
,Name,Value
)cuffgffread('gyrAB.gtf','gyrAB.gff','PreserveAttributes',true)
сохраняет все атрибуты в выходном файле.
Преобразуйте файл GTF в файл GFF при сохранении всех атрибутов.
cuffgffread('gyrAB.gtf','gyrABOut.gff','PreserveAttributes',true)
Можно также установить опции с помощью объекта. Например, задайте выход, чтобы быть в формате GTF.
opt = CuffGFFReadOptions; opt.GTFOutput = true; opt.PreserveAttributes = true; cuffgffread('gyrAB.gtf','gyrABOut.gtf',opt);
Если у вас есть объект опций, можно получить эквивалентные исходные опции для всех свойств объектов с помощью getOptionsTable
.
getOptionsTable(opt)
ans = 33×3 table PropertyName FlagName FlagShortName ___________________________ ________________ _____________ AppendDescription 'AppendDescription' '-A' '' CheckOppositeStrand 'CheckOppositeStrand' '-B' '' CheckPhase 'CheckPhase' '-H' '' Cluster 'Cluster' '--cluster-only' '' CodingOnly 'CodingOnly' '-C' '' CollapseContainer 'CollapseContainer' '-K' '' CollapseFull 'CollapseFull' '-Q' '' CoordinateRange 'CoordinateRange' '-r' '' DiscardInvalidCDS 'DiscardInvalidCDS' '-J' '' DiscardNonCanonicalSplice 'DiscardNonCanonicalSplice' '-N' '' DiscardSingleExon 'DiscardSingleExon' '-U' '' DiscardTerminatedCDS 'DiscardTerminatedCDS' '-V' '' FastaCDSFile 'FastaCDSFile' '-x' '' FastaExonsFile 'FastaExonsFile' '-w' '' FastaProteinFile 'FastaProteinFile' '-y' '' FirstExonOnly 'FirstExonOnly' '-G' '' ForceExons 'ForceExons' '--force-exons' '' FullyContained 'FullyContained' '-R' '' GTFOutput 'GTFOutput' '-T' '' MaxIntronLength 'MaxIntronLength' '-i' '' Merge 'Merge' '--merge' '-M' MergeCloseExons 'MergeCloseExons' '-Z' '' MergeInfoFile 'MergeInfoFile' '-d' '' PreserveAttributes 'PreserveAttributes' '-F' '' Pseudo 'Pseudo' '--no-pseudo' '' ReplacementTable 'ReplacementTable' '-m' '' SequenceFile 'SequenceFile' '-g' '' SequenceInfo 'SequenceInfo' '-s' '' UrlDecode 'UrlDecode' '-D' '' UseEnsemblConversion 'UseEnsemblConversion' '-L' '' UseNonTranscript 'UseNonTranscript' '-O' '' UseTrackName 'UseTrackName' '-t' '' WriteCoordinates 'WriteCoordinates' '-W' ''
input
— Введите имя файлаВведите имя файла, заданное как строка или вектор символов. Файл может быть GTF или файлом GFF.
Пример: 'gyrAB.gtf'
Типы данных: char |
string
output
— Имя выходного файлаИмя выходного файла, заданное как строка или вектор символов. По умолчанию выход является файлом GFF. Установите 'GTFOutput'
к true
получить выходной файл GTF.
Пример: 'gyrAB.gff'
Типы данных: char |
string
opt
— cuffgffread
опцииCuffGFFReadOptions
возразите | строка | вектор символовcuffgffread
опции, заданные как CuffGFFReadOptions
объект, строка или вектор символов. Строка или вектор символов должны быть в исходном gffread
синтаксис опции (снабженный префиксом одним или двумя тире) [1].
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
cuffgffread('gyrAB.gtf','gyrAB.gff','CoordinateRange','+NC_000912.1:4821..7340')
'AppendDescription'
— Отметьте, чтобы добавить описания файлов в descr
атрибутfalse
(значение по умолчанию) | true
Отметьте, чтобы добавить описания файлов от файлов последовательности до descr
атрибут записи выхода GFF, заданной как true
или false
. Задайте файлы последовательности с помощью SequenceInfo
опция.
Пример:
'AppendDescription',true
Типы данных: логический
'CheckOppositeStrand'
— Отметьте, чтобы проверять противоположную скрутку при проверке на кодоны остановки в системе координатfalse
(значение по умолчанию) | true
Отметьте, чтобы проверять противоположную скрутку при проверке на кодоны остановки в системе координат, заданные как true
или false
.
Пример:
'CheckOppositeStrand',true
Типы данных: логический
'CheckPhase'
— Отметьте, чтобы настроить фазу последовательности кодированияfalse
(значение по умолчанию) | true
Отметьте, чтобы настроить фазу последовательности кодирования при проверке на кодоны остановки в системе координат, заданные как true
или false
.
Пример:
'CheckPhase',true
Типы данных: логический
'Cluster'
— Отметьте к кластерным входным расшифровкам стенограммы в местаtrue
(значение по умолчанию) | false
Отметьте, чтобы кластеризировать входные расшифровки стенограммы в места, заданные как true
или false
. Эта опция совпадает с Merge
свойство, за исключением того, что это не сворачивает полностью содержавшие расшифровки стенограммы с идентичными интронами.
Пример:
'Cluster',false
Типы данных: логический
'CodingOnly'
— Отметьте, чтобы отбросить расшифровки стенограммы без кодирования последовательностиfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить расшифровки стенограммы без кодирования функции последовательности (CDS), заданный как true
или false
.
Пример:
'CodingOnly',true
Типы данных: логический
'CollapseContainer'
— Отметьте, чтобы свернуть полностью содержавшие расшифровки стенограммыfalse
(значение по умолчанию) | true
Отметьте, чтобы свернуть полностью содержавшие расшифровки стенограммы, которые короче с меньшим количеством интронов, чем контейнер, заданный как true
или false
. Это свойство применяется только, когда вы устанавливаете Merge
к true
.
Пример:
'CollapseContainer',true
Типы данных: логический
'CollapseFull'
— Отметьте, чтобы свернуть более короткие расшифровки стенограммы перекрывающиеся по крайней мере 80% с другим экзономfalse
(значение по умолчанию) | true
Отметьте, чтобы свернуть более короткие расшифровки стенограммы перекрывающиеся по крайней мере 80% с другой одной расшифровкой стенограммы экзона, заданной как true
или false
. Это свойство применяется только, когда вы устанавливаете Merge
к true
.
Пример:
'CollapseFull',true
Типы данных: логический
'CoordinateRange'
— Геномная область значений, чтобы отфильтровать расшифровки стенограммыГеномная область значений, чтобы отфильтровать расшифровки стенограммы, заданные как строка или вектор символов. Форматом должен быть "[[<strand>]<chr>:]<start>..<end>"
, где start
и end
геномные положения, chr
дополнительная хромосома или имя контига и дополнительный strand
('+'
или '-'
).
Пример:
'CoordinateRange',“+NC_000912.1:4821..7340”
Типы данных: char |
string
'DiscardInvalidCDS'
— Отметьте, чтобы проигнорировать mRNA расшифровки стенограммы, или недостаток запускает или останавливает кодон, или наличие в системе координат останавливают кодонfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать mRNA расшифровки стенограммы или недостаток в запуске или кодон остановки или наличие кодона остановки в системе координат, заданного как true
или false
.
Пример:
'DiscardInvalidCDS',true
Типы данных: логический
'DiscardNonCanonicalSplice'
— Отметьте, чтобы проигнорировать мультиэкзон mRNA расшифровки стенограммы, которые имеют интрон с неканонической последовательностью соединения встыкfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать мультиэкзон mRNA расшифровки стенограммы, которые имеют интрон с неканонической последовательностью соединения встык, заданной как true
или false
. Неканоническая последовательность соединения встык является любой последовательностью соединения встык кроме "GT-AG"
, "CG-AG"
, или "AT-AC"
.
Пример:
'DiscardNonCanonicalSplice',true
Типы данных: логический
'DiscardSingleExon'
— Отметьте, чтобы проигнорировать расшифровки стенограммы, охватывающие один экзонfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать расшифровки стенограммы, охватывающие один экзон, заданный как true
или false
.
Пример:
'DiscardSingleExon',true
Типы данных: логический
'DiscardTerminatedCDS'
— Отметьте, чтобы проигнорировать расшифровки стенограммы с кодоном остановки в системе координатfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать расшифровки стенограммы с кодоном остановки в системе координат, заданным как true
или false
.
Пример:
'DiscardTerminatedCDS',true
Типы данных: логический
'ExtraCommand'
— Дополнительные команды""
(значение по умолчанию) | вектор символов | строкаДополнительные команды, заданные как строка или вектор символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразует исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.
Пример: 'ExtraCommand',"-E"
Типы данных: char |
string
'FastaCDSFile'
— Имя файла, чтобы сохранить соединенные последовательности кодированияИмя файла, чтобы сохранить соединенные последовательности кодирования в формате FASTA, заданном как строка или вектор символов.
Пример:
'FastaCDSFile',"splicedCoding.FASTA"
Типы данных: char |
string
'FastaExonsFile'
— Имя файла, чтобы сохранить соединенные экзоныИмя файла, чтобы сохранить соединенные экзоны в формате FASTA, заданном как строка или вектор символов.
Пример:
'FastaExonsFile',"splicedExon.FASTA"
Типы данных: char |
string
'FastaProteinFile'
— Имя файла, чтобы сохранить перевод белка кодирования последовательностейИмя файла, чтобы сохранить перевод белка кодирования последовательностей в формате FASTA, заданном как строка или вектор символов.
Пример:
'FastaProteinFile',"translated.FASTA"
Типы данных: char |
string
'FirstExonOnly'
— Отметьте, чтобы проанализировать дополнительные атрибуты только от первого экзонаfalse
(значение по умолчанию) | true
Отметьте, чтобы проанализировать дополнительные атрибуты только от первого экзона, заданного как true
или false
.
Пример: 'FirstExonOnly',true
Типы данных: логический
'ForceExons'
— Отметьте, чтобы перечислить самый низкий уровень функции GFF как функции экзонаfalse
(значение по умолчанию) | true
Отметьте, чтобы перечислить самый низкий уровень функции GFF, когда экзон показывает в выходном файле, заданном как true
или false
.
Пример:
'ForceExons',true
Типы данных: логический
'FullyContained'
— Отметьте, чтобы отбросить расшифровки стенограммы, не содержавшие полностьюfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить расшифровки стенограммы, не содержавшие полностью в диапазоне, указанном как true
или false
. Укажите диапазон с помощью CoordinateRange
опция.
Пример:
'FullyContained',true
Типы данных: логический
'GTFOutput'
— Отметьте, чтобы вывести файлы расшифровки стенограммы формата GTFfalse
(значение по умолчанию) | true
Отметьте, чтобы вывести файлы расшифровки стенограммы формата GTF, заданные как true
или false
.
Пример:
'GTFOutput',true
Типы данных: логический
'IncludeAll'
— Отметьте, чтобы применить все доступные параметрыfalse
(значение по умолчанию) | true
Отметьте, чтобы включать все доступные параметры с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, заданный как true
или false
. Исходный синтаксис снабжается префиксом одним или двумя тире, такими как '-d 100 -e 80'
. По умолчанию функция преобразует только заданные опции. Если значением является true
, функция преобразует все доступные параметры, со значениями по умолчанию для незаданных опций, к исходному синтаксису.
Пример: 'IncludeAll',true
Типы данных: логический
'MaxIntronLength'
— Максимальная длина интрона для расшифровки стенограммы, чтобы включать в выходInf
(значение по умолчанию) | положительное целое числоМаксимальная длина интрона для расшифровки стенограммы, чтобы включать в выходной файл, заданный как положительное целое число. Inf
, значение по умолчанию, не устанавливает предела для длины интрона.
Пример:
'MaxIntronLength',500
Типы данных: double
'Merge'
— Отметьте, чтобы объединить расшифровки стенограммы к местамfalse
(значение по умолчанию) | true
Отметьте, чтобы объединить расшифровки стенограммы в места путем сворачивания расшифровок стенограммы с идентичными интронами, заданными как true
или false
.
Пример:
'Merge',true
Типы данных: логический
'MergeCloseExons'
— Отметьте, чтобы объединить экзоны в один экзонfalse
(значение по умолчанию) | true
Отметьте, чтобы объединить экзоны в один экзон, когда разделено меньше чем 4 интронами пары оснований, заданными как true
или false
.
Пример:
'MergeCloseExons',true
Типы данных: логический
'MergeInfoFile'
— Имя файла, чтобы сохранить информацию на копиях при слиянииИмя файла, чтобы сохранить информацию на копиях при слиянии, заданный как строка или вектор символов. Это свойство применяется только, когда вы устанавливаете Merge
к true
.
Пример:
'MergeInfoFile',"duplicates.txt"
Типы данных: char |
string
'PreserveAttributes'
— Отметьте, чтобы сохранить все атрибуты в выходеfalse
(значение по умолчанию) | true
Отметьте, чтобы сохранить все атрибуты в выходном файле, заданном как true
или false
.
Пример:
'PreserveAttributes',true
Типы данных: логический
'Pseudo'
— Отметьте, чтобы отфильтровать записи, содержащие "псевдо"true
(значение по умолчанию) | false
Отметьте, чтобы отфильтровать записи, содержащие слово, "псевдо", заданное как true
или false
.
Пример:
'Pseudo',false
Типы данных: логический
'ReplacementTable'
— Имя файла, содержащего заменяющую таблицуИмя файла, содержащего заменяющую таблицу, заданную как строка или вектор символов. Таблица должна иметь два столбца, где первый столбец содержит исходные идентификаторы расшифровки стенограммы, и второй столбец содержит новые идентификаторы расшифровки стенограммы. Таблица в качестве примера следует.
origTranscript1 | newTranscript1 |
origTranscript2 | newTranscript2 |
origTranscript3 | newTranscript3 |
Если вы предоставляете заменяющую таблицу, функция заменяет идентификаторы расшифровки стенограммы, найденные в первом столбце с новыми идентификаторами расшифровок стенограммы из второго столбца, и отфильтровывает те расшифровки стенограммы, не найденные.
Пример:
'ReplacementTable',"replaceTbl.txt"
Типы данных: char |
string
'SequenceFile'
— Имя FASTA-файла-формата, содержащего геномные последовательностиИмя FASTA-файла-формата, содержащего геномные последовательности для всех входных отображений, заданных как строка или вектор символов.
Пример:
'SequenceFile',"seqs.fasta"
Типы данных: char |
string
'SequenceInfo'
— Имя файла с разделением табуляцией с дополнительной информацией о входной последовательностиИмя файла с разделением табуляцией с дополнительной информацией о каждой входной последовательности, заданной как строка или вектор символов. Этот файл должен иметь три столбца: столбец имени последовательности, столбец длины последовательности и столбец описания последовательности. Если AppendDescription
true
, описание последовательности включено как атрибут в файле выхода GFF.
Пример:
'SequenceInfo',"seqinfo.txt"
Типы данных: char |
string
'UrlDecode'
— Отметьте, чтобы декодировать закодированные URL символы в названиях атрибутаfalse
(значение по умолчанию) | true
Отметьте, чтобы декодировать закодированные URL символы в названиях атрибута, заданных как true
или false
. Например, "transcript%20description" декодируется к "описанию расшифровки стенограммы".
Пример:
'UrlDecode',true
Типы данных: логический
'UseEnsemblConversion'
— Отметьте, чтобы использовать GTF-to-GFF3 метод преобразования от Ensemblfalse
(значение по умолчанию) | true
Отметьте, чтобы использовать GTF-to-GFF3 метод преобразования от Ensembl, заданного как true
или false
.
Пример:
'UseEnsemblConversion',true
Типы данных: логический
'UseNonTranscript'
— Отметьте, чтобы включать нерасшифровку стенограммы записи GFF в выходной файлfalse
(значение по умолчанию) | true
Отметьте, чтобы включать нерасшифровку стенограммы записи GFF в выходной файл, заданный как true
или false
.
Пример:
'UseNonTranscript',true
Типы данных: логический
'UseTrackName'
— Отметьте, чтобы использовать имя дорожки во втором столбце GFF линия выходаfalse
(значение по умолчанию) | true
Отметьте, чтобы использовать имя дорожки во втором столбце GFF линия выхода, заданная как true
или false
.
Пример:
'UseTrackName',true
Типы данных: логический
'WriteCoordinates'
— Отметьте, чтобы записать координаты экзона, спроектированные на соединенную последовательностьfalse
(значение по умолчанию) | true
Отметьте, чтобы записать координаты экзона, спроектированные на соединенную последовательность, заданную как true
или false
. Это свойство применяется только когда FastaExonsFile
или FastaCDSFile
задан.
Пример:
'WriteCoordinates',true
Типы данных: логический
[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки. Биотехнология природы. 28:511–515.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.