Набор опций для cuffcompare
A CuffCompareOptions
объект задает опции для cuffcompare
функция, которая сравнивает собранные транскрипты в нескольких экспериментах [1].
создает cuffcompareOpt
= CuffCompareOptionsCuffCompareOptions
объект со значениями свойств по умолчанию.
CuffCompareOptions
требуется пакет поддержки Cufflinks для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция предоставляет ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты поддержки ПО Bioinformatics Toolbox.
Примечание
CuffCompareOptions
поддерживается в Mac и UNIX® только платформы.
устанавливает свойства объекта с помощью одного или нескольких аргументов пары "имя-значение". Заключайте каждое имя свойства в кавычки. Для примера, cuffcompareOpt
= CuffCompareOptions(Name,Value)cuffcompareOpt = CuffCompareOptions('SupressMapFiles',true)
препятствует созданию .tmap
и .refmap
файлы.
задает необязательные параметры с помощью строкового или символьного вектора cuffcompareOpt
= CuffCompareOptions(S
)S
.
S
— cuffcompare
опцииcuffcompare
опции, заданные как строковый или символьный вектор. S
должен быть в исходном cuffcompare
синтаксис опции (префикс одним или двумя штрихами).
Пример: '-d 100 -e 80'
ConsensusPrefix
- Префикс для консенсусных имен транскриптов"TCONS"
(по умолчанию) | строку | вектор символовПрефикс для имен консенсусных транскриптов в выход combined.gtf
файл, заданный как строковый или символьный вектор. Эта опция должна быть строковым или символьным вектором с ненулевой длиной.
Пример: "consensusTs"
Типы данных: char
| string
DiscardIntronRedundant
- Флаг, чтобы игнорировать интронно-избыточные трансфрагмыfalse
(по умолчанию) | true
Флаг, чтобы игнорировать интронно-избыточные трансфрагмы, если они имеют те же 5 'end, но различные 3' ends, заданный как true
или false
.
Пример: true
Типы данных: logical
DiscardSingleExonAll
- Флаг для сброса транскриптов с одним экзоном и эталонных транскриптовfalse
(по умолчанию) | true
Флаг для сброса транскриптов с одним экзоном и эталонных транскриптов, заданный как true
или false
.
Пример: true
Типы данных: logical
DiscardSingleExonReference
- Флаг, чтобы отбросить одноэксонные эталонные транскриптыfalse
(по умолчанию) | true
Флаг для сброса одноэксонных эталонных транскриптов, заданный как true
или false
.
Пример: true
Типы данных: logical
ExtraCommand
- Дополнительные команды""
(по умолчанию) | строку | вектор символовКоманды должны быть в собственном синтаксисе (с префиксом один или два штриха). Используйте эту опцию для применения недокументированных флагов и флагов без соответствующего MATLAB® свойства.
Когда программа преобразует исходные флаги в свойства MATLAB, она сохраняет все неопознанные флаги в этом свойстве.
Пример: "--library-type fr-secondstrand"
Типы данных: char
| string
GTFManifest
- Имя текстового файла, содержащего список файлов GTF для обработкиИмя текстового файла, содержащего список файлов GTF для обработки, заданное как строка или вектор символов. Файл должен содержать по одному пути к файлу GTF на линию. Можно использовать эту опцию как альтернативу передаче массива имен файлов в cuffcompare
.
Пример: "gtfManifestFile.txt"
Типы данных: char
| string
GenericGFF
- Флаг для обработки входных файлов GTF как GFFfalse
(по умолчанию) | true
Флаг для обработки входных файлов GTF как файлов GFF, заданный как true
или false
. Используйте эту опцию, когда входные файлы GFF или GTF не производятся cufflinks
.
Пример: true
Типы данных: logical
IncludeAll
- Флаг для включения всех свойств объекта при преобразовании в исходный синтаксисfalse
(по умолчанию) | true
Флаг для включения всех свойств объекта с соответствующими значениями по умолчанию при преобразовании в синтаксис исходных опций, заданный как true
или false
. Можно преобразовать свойства в исходный синтаксис, префиксированный одним или двумя штрихами (такими как '-d 100 -e 80'
) при помощи getCommand
. Значение по умолчанию false
означает, что, когда вы вызываете getCommand(optionsObject)
преобразует только указанные свойства. Если значение true
, getCommand
преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств в исходный синтаксис.
Примечание
Если вы задаете IncludeAll
на true
программное обеспечение преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что когда значение по умолчанию свойства NaN
, Inf
, []
, ''
, или ""
, тогда программное обеспечение не преобразует соответствующее свойство.
Пример: true
Типы данных: logical
IncludeContained
- Флаг, включающий трансфрагмы, содержащиеся в других трансфрагмахfalse
(по умолчанию) | true
Флаг для включения трансфрагмов, содержащихся в других трансфрагмах в том же локусе, в выходной combined.gtf
, заданный как true
или false
. По умолчанию, cuffcompare
не включает эти содержащиеся трансфрагмы. Если значение true
, содержащиеся трансфрагмы включают в себя contained_in
атрибут, указывающий на обнаружение первого контейнера transfrag.
Пример:
true
Типы данных: logical
MaxAccuracyRange
- Количество основ от терминальных экзонов для использования при оценке точности экзонов100
(по умолчанию) | положительное целое числоКоличество основ из свободных концов терминальных экзонов для использования при оценке точности экзонов, заданное как положительное целое число.
Пример:
80
Типы данных: double
MaxGroupingRange
- Количество основ, используемых для группировки начальных сайтов транскрипта100
(по умолчанию) | положительное целое числоКоличество основ для группировки начальных сайтов транскрипта, заданное как положительное целое число.
Пример:
90
Типы данных: double
OutputPrefix
- Префикс для cuffcompare
выходные файлы"cuffcmp"
(по умолчанию) | строку | вектор символовПрефикс для cuffcompare
выходные файлы, заданные как строковый или символьный вектор. Эта опция должна быть строковым или символьным вектором с ненулевой длиной.
Пример:
"cuffcompareOut"
Типы данных: char
| string
ReferenceGTF
- Имя файла GTF или GFF, содержащего ссылочные транскриптыИмя файла GTF или GFF, содержащего ссылочные транскрипты для сравнения с каждой выборкой, заданное как строковый или символьный вектор. Если вы предоставляете файл, функция сравнивает каждую выборку со ссылками в файле и помечает изоформы как overlapping
, matching
, или novel
. Функция хранит эти теги в файлах выхода .refmap
и .tmap
файлы.
Пример:
"references.gtf"
Типы данных: char
| string
SequenceDirectory
- Имя каталога, содержащего FASTA-последовательности для классификации входных транскриптов как повторенийИмя директории, содержащего FASTA-последовательности для классификации входа транскриптов как повторений, заданное как строка или вектор символов. Эта директория должен содержать файлы FASTA-формата с базовыми геномными последовательностями и содержать по одному файлу FASTA на ссылку. Назовите каждый файл FASTA после хромосомы с расширением .fa
или .fasta
.
Пример: "./SequenceDirectory/"
Типы данных: char
| string
SnCorrection
- Флаг, чтобы рассматривать только ссылочные транскрипты, которые перекрываются с входными трансфрагмамиfalse
(по умолчанию) | true
Флаг, чтобы рассматривать только ссылочные транскрипты, которые перекрываются с любым из входных трансфрагмов, заданных как true
или false
. Если значение true
:
Функция игнорирует любые эталонные транскрипты, которые не перекрываются ни с одним из входных трансфрагмов.
Вы также должны задать ReferenceGTF
опция.
Пример:
true
Типы данных: logical
SpCorrection
- Флаг, чтобы рассматривать только входные транскрипты, которые перекрываются с эталонными транскриптамиfalse
(по умолчанию) | true
Флаг, чтобы рассматривать только входные транскрипты, которые перекрываются с любым из ссылочных транскриптов, заданных как true
или false
. Если значение true
:
Функция игнорирует любые входные транскрипты, которые не перекрываются ни с одним из эталонных транскриптов, и не сообщает никаких новых локусов.
Вы также должны задать ReferenceGTF
опция.
Пример:
true
Типы данных: logical
SuppressMapFiles
- Флаг для предотвращения создания .tmap
и .refmap
файлыfalse
(по умолчанию) | true
Флаг для предотвращения создания .tmap
и .refmap
файлы, заданные как true
или false
. Установите значение равным true
чтобы предотвратить генерацию файлов функцией.
Пример:
true
Типы данных: logical
Version
- Поддерживаемая версияЭто свойство доступно только для чтения.
Поддерживаемая версия программного обеспечения оригинальных запонок, возвращенная как строка.
Пример: "2.2.1"
Типы данных: string
getCommand | Переведите свойства объекта в синтаксис исходных опций |
getOptionsTable | Возвращает таблицу со всеми свойствами и эквивалентными опциями в исходном синтаксисе |
Создайте CuffCompareOptions
объект со значениями по умолчанию.
opt = CuffCompareOptions;
Создайте объект с помощью пар "имя-значение".
opt2 = CuffCompareOptions('GenericGFF',true,'MaxAccuracyRange',80)
Создайте объект с помощью исходного синтаксиса.
opt3 = CuffCompareOptions('-d 100 -e 80')
Создайте CufflinksOptions
объект, чтобы задать опции запонки, такие как количество параллельных нитей и выхода директории для хранения результатов.
cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";
Файлы, предоставленные для этого примера, содержат выровненные показания для Mycoplasma pneumoniae из двух выборок с тремя повторениями каждый. Считывания моделируются 100bp-считывания для двух генов (gyrA
и gyrB
) расположены рядом друг с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется cufflinks
.
sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",... "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];
Соберите транскриптом из выровненных показаний.
[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);
gtfs
представляет собой список файлов GTF, которые содержат собранные изоформы.
Сравнение собранных изоформ с помощью cuffcompare
.
stats = cuffcompare(gtfs);
Объедините собранные транскрипты с помощью cuffmerge
.
mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');
mergedGTF
сообщает только один транскрипт. Это потому, что два интересующих гена расположены рядом друг с другом, и cuffmerge
не может различать два разных гена. Вести cuffmerge
, используйте ссылку GTF (gyrAB.gtf
) содержащая информацию об этих двух генах. Если файл расположен не в той же директории, который вы запускаете cuffmerge
от, вы также должны задать путь к файлу.
gyrAB = which('gyrAB.gtf'); mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',... 'ReferenceGTF',gyrAB);
Вычислите изобилие (уровни выражения) из выровненных показаний для каждой выборки.
abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... 'OutputDirectory','./cuffquantOutput1'); abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],... 'OutputDirectory','./cuffquantOutput2');
Оцените значимость изменений экспрессии для генов и транскриптов между условиями, выполнив дифференциальную проверку с использованием cuffdiff
. cuffdiff
функция действует в двух разных шагах: функция сначала оценивает изобилие по выровненным чтениям, а затем выполняет статистический анализ. В некоторых случаях (для примера, распределение вычислительной нагрузки между несколькими работниками), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant
, можно затем использовать двоичный выходной файл CXB в качестве входов для cuffdiff
для выполнения статистического анализа. Поскольку cuffdiff
возвращает несколько файлов, задает рекомендуемую выходную директорию.
isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],... 'OutputDirectory','./cuffdiffOutput');
Отобразите таблицу, содержащую результаты дифференциального экспрессионного теста для этих двух генов gyrB
и gyrA
.
readtable(isoformDiff,'FileType','text')
ans = 2×14 table test_id gene_id gene locus sample_1 sample_2 status value_1 value_2 log2_fold_change_ test_stat p_value q_value significant ________________ _____________ ______ _______________________ ________ ________ ______ __________ __________ _________________ _________ _______ _______ ___________ 'TCONS_00000001' 'XLOC_000001' 'gyrB' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 1.0913e+05 4.2228e+05 1.9522 7.8886 5e-05 5e-05 'yes' 'TCONS_00000002' 'XLOC_000001' 'gyrA' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 3.5158e+05 1.1546e+05 -1.6064 -7.3811 5e-05 5e-05 'yes'
Вы можете использовать cuffnorm
чтобы сгенерировать нормированные таблицы выражений для последующих анализов. cuffnorm
результаты полезны, когда у вас есть много выборки, и вы хотите объединить их или построить уровни экспрессии для генов, которые важны в вашем исследовании. Обратите внимание, что вы не можете выполнить дифференциальный анализ выражения, используя cuffnorm
.
Задайте массив ячеек, где каждый элемент является строковым вектором, содержащим имена файлов для одной выборки с репликами.
alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]} isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,... 'OutputDirectory', './cuffnormOutput');
Отобразите таблицу, содержащую нормированные уровни выражения для каждого транскрипта.
readtable(isoformNorm,'FileType','text')
ans = 2×7 table tracking_id q1_0 q1_2 q1_1 q2_1 q2_0 q2_2 ________________ __________ __________ __________ __________ __________ __________ 'TCONS_00000001' 1.0913e+05 78628 1.2132e+05 4.3639e+05 4.2228e+05 4.2814e+05 'TCONS_00000002' 3.5158e+05 3.7458e+05 3.4238e+05 1.0483e+05 1.1546e+05 1.1105e+05
Имена столбцов, начинающиеся с q, имеют формат conditionX_N, указывающий, что столбец содержит значения для репликации N conditionX.
[1] Трапнелл, Коул, Брайан А Уильямс, Гео Пертея, Али Мортазави, Гордон Кван, Марийке Дж. Ван Барен, Стивен Л Зальцберг, Барбара Дж. Уолд и Лиор Пахтер. «Сборка транскрипта и количественное определение РНК-Seq обнаруживает неаннотированные транскрипты и переключение изоформы во время дифференциации камер». Биотехнология природы 28, № 5 (май 2010): 511-15.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.