Набор опций для cuffcompare
CuffCompareOptions
объект задает опции для cuffcompare
функция, которая сравнивает собранные расшифровки стенограммы через несколько экспериментов [1].
создает cuffcompareOpt
= CuffCompareOptionsCuffCompareOptions
объект со значениями свойств по умолчанию.
CuffCompareOptions
требует Пакета поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку. Для получения дополнительной информации смотрите Пакеты Программной поддержки Bioinformatics Toolbox.
Примечание
CuffCompareOptions
поддерживается на Mac и UNIX® платформы только.
устанавливает свойства объектов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, cuffcompareOpt
= CuffCompareOptions(Name,Value)cuffcompareOpt = CuffCompareOptions('SupressMapFiles',true)
предотвращает создание .tmap
и .refmap
файлы.
задает дополнительные параметры с помощью строки или вектора символов cuffcompareOpt
= CuffCompareOptions(S
)S
.
S
— cuffcompare
опцииcuffcompare
опции в виде строки или вектора символов. S
должен быть в исходном cuffcompare
синтаксис опции (снабженный префиксом одним или двумя тире).
Пример: '-d 100 -e 80'
ConsensusPrefix
— Префикс для имен расшифровки стенограммы согласия"TCONS"
(значение по умолчанию) | представляет в виде строки | вектор символовПрефикс для расшифровки стенограммы согласия называет в выходе combined.gtf
файл в виде строки или вектора символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.
Пример: "consensusTs"
Типы данных: char |
string
DiscardIntronRedundant
— Отметьте, чтобы проигнорировать избыточный интроном transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы проигнорировать избыточный интроном transfrags, если у них есть те же 5' концов, но различные 3' конца в виде true
или false
.
Пример: true
Типы данных: логический
DiscardSingleExonAll
— Отметьте, чтобы отбросить одно экзон transfrags и ссылочные расшифровки стенограммыfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить одно экзон transfrags и ссылочные расшифровки стенограммы в виде true
или false
.
Пример: true
Типы данных: логический
DiscardSingleExonReference
— Отметьте, чтобы отбросить расшифровки стенограммы ссылки одно экзонаfalse
(значение по умолчанию) | true
Отметьте, чтобы отбросить расшифровки стенограммы ссылки одно экзона в виде true
или false
.
Пример: true
Типы данных: логический
ExtraCommand
— Дополнительные команды""
(значение по умолчанию) | представляет в виде строки | вектор символовКоманды должны быть в нативном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующего MATLAB® свойства.
Когда программное обеспечение преобразует исходные флаги в свойства MATLAB, оно хранит любые нераспознанные флаги в этом свойстве.
Пример: "--library-type fr-secondstrand"
Типы данных: char |
string
GTFManifest
— Имя текстового файла, содержащего список файлов GTF к процессуИмя текстового файла, содержащего список файлов GTF к процессу в виде строки или вектора символов. Файл должен содержать один путь к файлу GTF на строку. Можно использовать эту опцию в качестве альтернативы передаче массива имен файлов к cuffcompare
.
Пример: "gtfManifestFile.txt"
Типы данных: char |
string
GenericGFF
— Отметьте, чтобы обработать файлы входа GTF как GFFfalse
(значение по умолчанию) | true
Отметьте, чтобы обработать файлы входа GTF как файлы GFF в виде true
или false
. Используйте эту опцию, когда файлы входа GFF или GTF не будут произведены cufflinks
.
Пример: true
Типы данных: логический
IncludeAll
— Отметьте, чтобы включать все свойства объектов при преобразовании в исходный синтаксисfalse
(значение по умолчанию) | true
Отметьте, чтобы включать все свойства объектов с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций в виде true
или false
. Можно преобразовать свойства в исходный синтаксис, снабженный префиксом одним или двумя тире (такими как '-d 100 -e 80'
) при помощи getCommand
. Значение по умолчанию false
средние значения это, когда вы вызываете getCommand(optionsObject)
, это преобразует только заданные свойства. Если значением является true
, getCommand
преобразует все доступные свойства, со значениями по умолчанию для незаданных свойств, к исходному синтаксису.
Примечание
Если вы устанавливаете IncludeAll
к true
, программное обеспечение переводит все доступные свойства со значениями по умолчанию для незаданных свойств. Единственное исключение - это, когда значением по умолчанию свойства является NaN
Inf
, []
, ''
, или ""
, затем программное обеспечение не переводит соответствующее свойство.
Пример: true
Типы данных: логический
IncludeContained
— Отметьте, чтобы включать transfrags, содержавший в другом transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы включать transfrags, содержавший в другом transfrags в том же местоположении в выходе combined.gtf
В виде true
или false
. По умолчанию, cuffcompare
не включает они содержали transfrags. Если значением является true
, содержавшие transfrags включают contained_in
атрибут, указывающий на первый контейнер transfrag найденный.
Пример:
true
Типы данных: логический
MaxAccuracyRange
— Количество основ от терминальных экзонов, чтобы использовать при оценке точности экзона
(значение по умолчанию) | положительное целое числоКоличество основ от свободных концов терминальных экзонов, чтобы использовать при оценке точности экзона в виде положительного целого числа.
Пример:
80
Типы данных: double
MaxGroupingRange
— Количество основ, чтобы использовать для группировки расшифровки стенограммы создает сайты
(значение по умолчанию) | положительное целое числоКоличество основ, чтобы использовать для группировки расшифровки стенограммы создает сайты в виде положительного целого числа.
Пример:
90
Типы данных: double
OutputPrefix
— Префикс для cuffcompare
выходные файлы"cuffcmp"
(значение по умолчанию) | представляет в виде строки | вектор символовПрефикс для cuffcompare
выходные файлы в виде строки или вектора символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.
Пример:
"cuffcompareOut"
Типы данных: char |
string
ReferenceGTF
— Имя GTF или файла GFF, содержащего ссылочные расшифровки стенограммыИмя GTF или файла GFF, содержащего ссылочные расшифровки стенограммы, чтобы выдержать сравнение с каждой выборкой в виде строки или вектора символов. Если вы обеспечиваете файл, функция сравнивает каждую выборку со ссылками в файле и отмечает изоформы как overlapping
, matching
, или novel
. Функция хранит эти теги в выходных файлах .refmap
и .tmap
файлы.
Пример:
"references.gtf"
Типы данных: char |
string
SequenceDirectory
— Имя директории, содержащей последовательности FASTA, чтобы классифицировать входные расшифровки стенограммы как повторенияИмя директории, содержащей последовательности FASTA, чтобы классифицировать входные расшифровки стенограммы как повторения в виде строки или вектора символов. Директория должна содержать FASTA-файлы-формата с базовыми геномными последовательностями и содержать один файл FASTA на ссылку. Назовите каждый файл FASTA в честь хромосомы с дополнительным .fa
или .fasta
.
Пример: "./SequenceDirectory/"
Типы данных: char |
string
SnCorrection
— Отметьте, чтобы рассмотреть только ссылочные расшифровки стенограммы, которые перекрываются с входом transfragsfalse
(значение по умолчанию) | true
Отметьте, чтобы рассмотреть только ссылочные расшифровки стенограммы, которые перекрываются с любым входом transfrags в виде true
или false
. Если значением является true
:
Функция игнорирует любые ссылочные расшифровки стенограммы, которые не перекрываются ни с одним входом transfrags.
Необходимо также задать ReferenceGTF
опция.
Пример:
true
Типы данных: логический
SpCorrection
— Отметьте, чтобы рассмотреть только входные расшифровки стенограммы, которые перекрываются со ссылочными расшифровками стенограммыfalse
(значение по умолчанию) | true
Отметьте, чтобы рассмотреть только входные расшифровки стенограммы, которые перекрываются с любой из ссылочных расшифровок стенограммы в виде true
или false
. Если значением является true
:
Функция игнорирует любые входные расшифровки стенограммы, которые не перекрываются ни с одной из ссылочных расшифровок стенограммы, и не сообщает ни о каких новых местах.
Необходимо также задать ReferenceGTF
опция.
Пример:
true
Типы данных: логический
SuppressMapFiles
— Отметьте, чтобы предотвратить создание .tmap
и .refmap
файлыfalse
(значение по умолчанию) | true
Отметьте, чтобы предотвратить создание .tmap
и .refmap
файлы в виде true
или false
. Установите значение к true
препятствовать тому, чтобы функция генерировала файлы.
Пример:
true
Типы данных: логический
Version
— Поддерживаемая версияЭто свойство доступно только для чтения.
Поддерживаемая версия исходного программного обеспечения запонок, возвращенного как строка.
Пример: "2.2.1"
Типы данных: string
getCommand | Переведите свойства объектов в исходный синтаксис опций |
getOptionsTable | Возвратите таблицу со всеми свойствами и эквивалентные опции в исходном синтаксисе |
Создайте CuffCompareOptions
объект со значениями по умолчанию.
opt = CuffCompareOptions;
Создайте объект с помощью пар "имя-значение".
opt2 = CuffCompareOptions('GenericGFF',true,'MaxAccuracyRange',80)
Создайте объект с помощью исходного синтаксиса.
opt3 = CuffCompareOptions('-d 100 -e 80')
Создайте CufflinksOptions
объект задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.
cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";
Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения симулированы 100bp-чтения для двух генов (gyrA
и gyrB
) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks
.
sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",... "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];
Соберите транскриптом от выровненных чтений.
[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);
gtfs
список файлов GTF, которые содержат собранные изоформы.
Сравните собранное использование изоформ cuffcompare
.
stats = cuffcompare(gtfs);
Объедините собранное использование расшифровок стенограммы cuffmerge
.
mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');
mergedGTF
отчеты только одна расшифровка стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом, и cuffmerge
не может отличить два отличных гена. Вести cuffmerge
, используйте ссылочный GTF (gyrAB.gtf
) содержа информацию об этих двух генах. Если файл не расположен в той же директории, которую вы запускаете cuffmerge
от, необходимо также задать путь к файлу.
gyrAB = which('gyrAB.gtf'); mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',... 'ReferenceGTF',gyrAB);
Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.
abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... 'OutputDirectory','./cuffquantOutput1'); abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],... 'OutputDirectory','./cuffquantOutput2');
Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения использования тестирования дифференциала cuffdiff
. cuffdiff
функция действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant
, можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff
выполнять статистический анализ. Поскольку cuffdiff
возвращает несколько файлов, укажите, что выходная директория рекомендуется.
isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],... 'OutputDirectory','./cuffdiffOutput');
Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB
и gyrA
.
readtable(isoformDiff,'FileType','text')
ans = 2×14 table test_id gene_id gene locus sample_1 sample_2 status value_1 value_2 log2_fold_change_ test_stat p_value q_value significant ________________ _____________ ______ _______________________ ________ ________ ______ __________ __________ _________________ _________ _______ _______ ___________ 'TCONS_00000001' 'XLOC_000001' 'gyrB' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 1.0913e+05 4.2228e+05 1.9522 7.8886 5e-05 5e-05 'yes' 'TCONS_00000002' 'XLOC_000001' 'gyrA' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 3.5158e+05 1.1546e+05 -1.6064 -7.3811 5e-05 5e-05 'yes'
Можно использовать cuffnorm
сгенерировать нормированные таблицы выражения для последующих анализов. cuffnorm
результаты полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальное аналитическое использование выражения cuffnorm
.
Задайте массив ячеек, где каждым элементом является вектор строки, содержащий имена файлов для одной выборки с, реплицирует.
alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]} isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,... 'OutputDirectory', './cuffnormOutput');
Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.
readtable(isoformNorm,'FileType','text')
ans = 2×7 table tracking_id q1_0 q1_2 q1_1 q2_1 q2_0 q2_2 ________________ __________ __________ __________ __________ __________ __________ 'TCONS_00000001' 1.0913e+05 78628 1.2132e+05 4.3639e+05 4.2228e+05 4.2814e+05 'TCONS_00000002' 3.5158e+05 3.7458e+05 3.4238e+05 1.0483e+05 1.1546e+05 1.1105e+05
Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.
[1] Trapnell, Капуста, Брайан А Уильямс, Гео Pertea, Али Мортэзэви, Гордон Кван, Мэриджк Дж ван Бэрен, Стивен Л Залцберг, Барбара Дж Уолд и Лайор Пэчтер. “Блок расшифровки стенограммы и Квантификация RNA-Seq Показывают Неаннотируемые Расшифровки стенограммы и Изоформу, Переключающуюся во время Клеточной дифференцировки”. Биотехнология природы 28, № 5 (май 2010): 511–15.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.