Сравните собранные расшифровки стенограммы через несколько экспериментов
сравнивает собранные расшифровки стенограммы в statsFile
= cuffcompare(gtfFiles
)gtfFiles
и возвращает итоговую статистику в выходном файле statsFile
[1].
cuffcompare
требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.
cuffcompare
поддерживается на Mac и платформах UNIX® только.
дополнительные опции использования заданы statsFile
= cuffcompare(gtfFiles
,compareOptions
)compareOptions
.
дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, statsFile
= cuffcompare(gtfFiles
,Name,Value
)statsFile = cuffcompare(gtfFile,'OutputPrefix',"cuffComp")
добавляет префиксный "cuffComp"
к именам выходного файла.
[
возвращает имена выходных файлов с помощью любой из комбинаций входных аргументов в предыдущих синтаксисах. По умолчанию функция сохранила все файлы к текущему каталогу.statsFile
,combinedGTF
,lociFile
,trackingFile
] = cuffcompare(___)
Создайте CufflinksOptions
объект задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.
cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";
Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения симулированы 100bp-чтения для двух генов (gyrA
и gyrB
) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks
.
sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",... "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];
Соберите транскриптом от выровненных чтений.
[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);
gtfs
список файлов GTF, которые содержат собранные изоформы.
Сравните собранные изоформы с помощью cuffcompare
.
stats = cuffcompare(gtfs);
Объедините собранные расшифровки стенограммы с помощью cuffmerge
.
mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');
mergedGTF
отчеты только одна расшифровка стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом и cuffmerge
не может отличить два отличных гена. Вести cuffmerge
, используйте ссылочный GTF (gyrAB.gtf
) содержа информацию об этих двух генах. Если файл не расположен в той же директории, что вы запускаете cuffmerge
от, необходимо также задать путь к файлу.
gyrAB = which('gyrAB.gtf'); mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',... 'ReferenceGTF',gyrAB);
Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.
abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... 'OutputDirectory','./cuffquantOutput1'); abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],... 'OutputDirectory','./cuffquantOutput2');
Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения тестирования дифференциала с помощью cuffdiff
. cuffdiff
функция действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant
, можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff
выполнять статистический анализ. Поскольку cuffdiff
возвращает несколько файлов, укажите, что выходная директория рекомендуется.
isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],... 'OutputDirectory','./cuffdiffOutput');
Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB
и gyrA
.
readtable(isoformDiff,'FileType','text')
ans = 2×14 table test_id gene_id gene locus sample_1 sample_2 status value_1 value_2 log2_fold_change_ test_stat p_value q_value significant ________________ _____________ ______ _______________________ ________ ________ ______ __________ __________ _________________ _________ _______ _______ ___________ 'TCONS_00000001' 'XLOC_000001' 'gyrB' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 1.0913e+05 4.2228e+05 1.9522 7.8886 5e-05 5e-05 'yes' 'TCONS_00000002' 'XLOC_000001' 'gyrA' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 3.5158e+05 1.1546e+05 -1.6064 -7.3811 5e-05 5e-05 'yes'
Можно использовать cuffnorm
сгенерировать нормированные таблицы выражения для последующих анализов. cuffnorm
результаты полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальный анализ выражения с помощью cuffnorm
.
Задайте массив ячеек, где каждый элемент является вектором строки, содержащим имена файлов для одной выборки с, реплицирует.
alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]} isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,... 'OutputDirectory', './cuffnormOutput');
Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.
readtable(isoformNorm,'FileType','text')
ans = 2×7 table tracking_id q1_0 q1_2 q1_1 q2_1 q2_0 q2_2 ________________ __________ __________ __________ __________ __________ __________ 'TCONS_00000001' 1.0913e+05 78628 1.2132e+05 4.3639e+05 4.2228e+05 4.2814e+05 'TCONS_00000002' 3.5158e+05 3.7458e+05 3.4238e+05 1.0483e+05 1.1546e+05 1.1105e+05
Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.
gtfFiles
— Имена файлов GTFИмена файлов GTF, заданных как вектор строки или массив ячеек из символьных векторов. Каждый файл GTF соответствует выборке, произведенной cufflinks
.
Пример: ["Myco_1_1.transcripts.gtf","Myco_2_1.transcripts.gtf"]
Типы данных: string
| cell
compareOptions
— cuffcompare
опцииCuffCompareOptions
возразите | вектор символов | строкаcuffcompare
опции, заданные как CuffCompareOptions
объект, вектор символов или строка. Вектор символов или строка должны быть в исходном cuffcompare
синтаксис опции (снабженный префиксом одним или двумя тире), такими как '-d 100 -e 80'
[1].
Задайте дополнительные разделенные запятой пары Name,Value
аргументы. Name
имя аргумента и Value
соответствующее значение. Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN
.
statsFile = cuffcompare(gtfFile,'OutputPrefix',"cuffComp",'MaxGroupingRange',90)
'ConsensusPrefix'
— Префикс для имен расшифровки стенограммы согласия"TCONS"
(значение по умолчанию) | представляет в виде строки | вектор символовПрефикс для расшифровки стенограммы согласия называет в выходе combined.gtf
файл, заданный как строка или вектор символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.
Пример: 'ConsensusPrefix',"consensusTs"
Типы данных: char |
string
'DiscardIntronRedundant'
— Отметьте, чтобы проигнорировать избыточный интроном transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать избыточный интроном transfrags, если у них есть те же 5' концов, но различные 3' конца, заданные как true
или false
.
Пример: 'DiscardIntronRedundant',true
Типы данных: логический
'DiscardSingleExonAll'
— Отметьте, чтобы отбросить одно экзон transfrags и ссылочные расшифровки стенограммыfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить одно экзон transfrags и ссылочные расшифровки стенограммы, заданные как true
или false
.
Пример: 'DiscardSingleExonAll',true
Типы данных: логический
'DiscardSingleExonReference'
— Отметьте, чтобы отбросить расшифровки стенограммы ссылки одно экзонаfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить расшифровки стенограммы ссылки одно экзона, заданные как true
или false
.
Пример: 'DiscardSingleExonReference',true
Типы данных: логический
'ExtraCommand'
— Дополнительные команды""
(значение по умолчанию) | вектор символов | строкаДополнительные команды, заданные как строка или вектор символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразует исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.
Пример: 'ExtraCommand',"--library-type fr-secondstrand"
Типы данных: char |
string
'GTFManifest'
— Имя текстового файла, содержащего список файлов GTF к процессуИмя текстового файла, содержащего список файлов GTF к процессу, заданному как строка или вектор символов. Файл должен содержать один путь к файлу GTF на строку. Можно использовать эту опцию в качестве альтернативы передаче массива имен файлов к cuffcompare
.
Пример: 'GTFManifest',"gtfManifestFile.txt"
Типы данных: char |
string
'GenericGFF'
— Отметьте, чтобы обработать файлы входа GTF как GFFfalse
(значение по умолчанию) | true
Отметьте, чтобы обработать файлы входа GTF как файлы GFF, заданные как true
или false
. Используйте эту опцию, когда файлы входа GFF или GTF не будут произведены cufflinks
.
Пример: 'GenericGFF',true
Типы данных: логический
'IncludeAll'
— Отметьте, чтобы включать все доступные параметрыfalse
(значение по умолчанию) | true
Отметьте, чтобы включать все доступные параметры с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, заданный как true
или false
. Исходный синтаксис снабжается префиксом одним или двумя тире, такими как '-d 100 -e 80'
. По умолчанию функция преобразует только заданные опции. Если значением является true
, функция преобразует все доступные параметры, со значениями по умолчанию для незаданных опций, к исходному синтаксису.
Пример: 'IncludeAll',true
Типы данных: логический
'IncludeContained'
— Отметьте, чтобы включать transfrags, содержавший в другом transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы включать transfrags, содержавший в другом transfrags в том же местоположении в выходе combined.gtf
, заданный как true
или false
. По умолчанию, cuffcompare
не включает они содержали transfrags. Если значением является true
, содержавшие transfrags включают contained_in
атрибут, указывающий на первый контейнер transfrag найденный.
Пример:
'IncludeContained',true
Типы данных: логический
'MaxAccuracyRange'
— Количество основ от терминальных экзонов, чтобы использовать при оценке точности экзона
(значение по умолчанию) | положительное целое числоКоличество основ от свободных концов терминальных экзонов, чтобы использовать при оценке точности экзона, заданной как положительное целое число.
Пример:
'MaxAccuracyRange',80
Типы данных: double
'MaxGroupingRange'
— Количество основ, чтобы использовать в группировке расшифровки стенограммы создает сайты
(значение по умолчанию) | положительное целое числоКоличество основ, чтобы использовать в группировке расшифровки стенограммы создает сайты, заданные как положительное целое число.
Пример:
'MaxGroupingRange',90
Типы данных: double
'OutputPrefix'
— Префикс для cuffcompare
выходные файлы"cuffcmp"
(значение по умолчанию) | представляет в виде строки | вектор символовПрефикс для cuffcompare
выходные файлы, заданные как строка или вектор символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.
Пример:
'OutputPrefix',"cuffcompareOut"
Типы данных: char |
string
'ReferenceGTF'
— Имя GTF или файла GFF, содержащего ссылочные расшифровки стенограммыИмя GTF или файла GFF, содержащего ссылочные расшифровки стенограммы, чтобы выдержать сравнение с каждой выборкой, заданной как строка или вектор символов. Если вы обеспечиваете файл, функция сравнивает каждую выборку со ссылками в файле и отмечает изоформы как overlapping
, matching
, или novel
. Функция хранит эти теги в выходных файлах .refmap
и .tmap
файлы.
Пример:
'ReferenceGTF',"references.gtf"
Типы данных: char |
string
'SequenceDirectory'
— Имя директории, содержащей последовательности FASTA, чтобы классифицировать входные расшифровки стенограммы как повторенияИмя директории, содержащей последовательности FASTA, чтобы классифицировать входные расшифровки стенограммы как повторения, заданные как строка или вектор символов. Директория должна содержать FASTA-файлы-формата с базовыми геномными последовательностями и содержать один файл FASTA на ссылку. Назовите каждый файл FASTA в честь хромосомы с дополнительным .fa
или .fasta
.
Пример: 'SequenceDirectory',"./SequenceDirectory/"
Типы данных: char |
string
'SnCorrection'
— Отметьте, чтобы рассмотреть только ссылочные расшифровки стенограммы, которые накладываются с входом transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы рассмотреть только ссылочные расшифровки стенограммы, которые накладываются с любым входом transfrags, заданный как true
или false
. Если значением является true
:
Функция игнорирует любые ссылочные расшифровки стенограммы, которые не накладываются ни с одним входом transfrags.
Необходимо также задать ReferenceGTF
опция.
Пример:
'SnCorrection',true
Типы данных: логический
'SpCorrection'
— Отметьте, чтобы рассмотреть только входные расшифровки стенограммы, которые накладываются со ссылочными расшифровками стенограммыfalse
(значение по умолчанию) | true
Отметьте, чтобы рассмотреть только входные расшифровки стенограммы, которые накладываются с любой из ссылочных расшифровок стенограммы, заданных как true
или false
. Если значением является true
:
Функция игнорирует любые входные расшифровки стенограммы, которые не накладываются ни с одной из ссылочных расшифровок стенограммы, и не сообщает ни о каких новых местах.
Необходимо также задать ReferenceGTF
опция.
Пример:
'SpCorrection',true
Типы данных: логический
'SuppressMapFiles'
— Отметьте, чтобы предотвратить создание .tmap
и .refmap
файлыfalse
(значение по умолчанию) | true
Отметьте, чтобы предотвратить создание .tmap
и .refmap
файлы, заданные как true
или false
. Установите значение к true
препятствовать тому, чтобы функция генерировала файлы.
Пример:
'SuppressMapFiles',true
Типы данных: логический
statsFile
— Имя текстового файла, содержащего статистику"cuffcmp.stats"
Имя текстового файла, содержащего статистику, связанную с точностью расшифровок стенограммы в каждой выборке, возвращенной как строка. Функция выполняет тесты для чувствительности (Sn) и специфики (SP) на различных уровнях, включая нуклеотид, экзон и уровни интрона, и сообщает о результатах в этом файле.
Именем файла по умолчанию является "cuffcmp.stats"
. Если вы задаете OutputPrefix
, функция использует его вместо "cuffcmp"
.
combinedGTF
— Имя файла, содержащего объединение всего transfrags в каждой выборке"cuffcmp.combined.gtf"
Имя файла, содержащего объединение всего transfrags в каждой выборке, возвращенной как строка.
Именем файла по умолчанию является "cuffcmp.combined.gtf"
. Если вы задаете OutputPrefix
, функция использует его вместо "cuffcmp"
.
lociFile
— Имя файла со всеми обработанными местами"cuffcmp.loci"
Имя файла со всеми обработанными местами через все расшифровки стенограммы, возвращенные как строка.
Именем файла по умолчанию является "cuffcmp.loci"
. Если вы задаете OutputPrefix
, функция использует его вместо "cuffcmp"
.
trackingFile
— Имя файла, содержащего расшифровки стенограммы с идентичными координатами"cuffcmp.tracking"
Имя файла, содержащего расшифровки стенограммы с идентичными координатами, интронами, и скрутками, возвратилось как строка.
Именем файла по умолчанию является "cuffcmp.tracking"
. Если вы задаете OutputPrefix
, функция использует его вместо "cuffcmp"
.
[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки. Биотехнология природы. 28:511–515.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.