Нормируйте уровни экспрессии расшифровки стенограммы
cuffnorm(transcriptsAnnot,alignmentFiles)
cuffnorm(transcriptsAnnot,alignmentFiles,opt)
cuffnorm(transcriptsAnnot,alignmentFiles,Name,Value)
[isoform,gene,tss,cds] = cuffnorm(___)
cuffnorm(
нормирует выражение расшифровки стенограммы к FPKM для выборок в transcriptsAnnot
,alignmentFiles
)alignmentFiles
и исправляет для различий в размере библиотеки [1].
cuffnorm
требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.
cuffnorm
поддерживается на Mac и платформах UNIX® только.
cuffnorm(
дополнительные опции использования заданы transcriptsAnnot
,alignmentFiles
,opt
)opt
.
cuffnorm(
дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, transcriptsAnnot
,alignmentFiles
,Name,Value
)cuffnorm('gyrAB.gtf',["Myco_1_1.sam", "Myco_2_1.sam"],'NumThreads',5)
задает, чтобы использовать пять параллельных потоков.
Создайте объект CufflinksOptions
задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.
cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";
Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения моделируются 100bp-чтения для двух генов (gyrA
и gyrB
) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks
.
sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",... "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];
Соберите транскриптом от выровненных чтений.
[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);
gtfs
является списком файлов GTF, которые содержат собранные изоформы.
Сравните собранные изоформы с помощью cuffcompare
.
stats = cuffcompare(gtfs);
Объедините собранные расшифровки стенограммы с помощью cuffmerge
.
mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');
mergedGTF
сообщает о только одной расшифровке стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом, и cuffmerge
не может отличить два отличных гена. Чтобы вести cuffmerge
, используйте ссылочный GTF (gyrAB.gtf
), содержащий информацию об этих двух генах. Если файл не расположен в той же директории, от которой вы запускаете cuffmerge
, необходимо также задать путь к файлу.
gyrAB = which('gyrAB.gtf'); mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',... 'ReferenceGTF',gyrAB);
Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.
abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... 'OutputDirectory','./cuffquantOutput1'); abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],... 'OutputDirectory','./cuffquantOutput2');
Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения тестирования дифференциала с помощью cuffdiff
. Функция cuffdiff
действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant
можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff
, чтобы выполнить статистический анализ. Поскольку cuffdiff
возвращает несколько файлов, укажите, что выходная директория рекомендуется.
isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],... 'OutputDirectory','./cuffdiffOutput');
Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB
и gyrA
.
readtable(isoformDiff,'FileType','text')
ans = 2×14 table test_id gene_id gene locus sample_1 sample_2 status value_1 value_2 log2_fold_change_ test_stat p_value q_value significant ________________ _____________ ______ _______________________ ________ ________ ______ __________ __________ _________________ _________ _______ _______ ___________ 'TCONS_00000001' 'XLOC_000001' 'gyrB' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 1.0913e+05 4.2228e+05 1.9522 7.8886 5e-05 5e-05 'yes' 'TCONS_00000002' 'XLOC_000001' 'gyrA' 'NC_000912.1:2868-7340' 'q1' 'q2' 'OK' 3.5158e+05 1.1546e+05 -1.6064 -7.3811 5e-05 5e-05 'yes'
Можно использовать cuffnorm
, чтобы сгенерировать нормированные таблицы выражения для последующих анализов. результаты cuffnorm
полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальный анализ выражения с помощью cuffnorm
.
Задайте массив ячеек, где каждый элемент является вектором строки, содержащим имена файлов для одной выборки с, реплицирует.
alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],... ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]} isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,... 'OutputDirectory', './cuffnormOutput');
Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.
readtable(isoformNorm,'FileType','text')
ans = 2×7 table tracking_id q1_0 q1_2 q1_1 q2_1 q2_0 q2_2 ________________ __________ __________ __________ __________ __________ __________ 'TCONS_00000001' 1.0913e+05 78628 1.2132e+05 4.3639e+05 4.2228e+05 4.2814e+05 'TCONS_00000002' 3.5158e+05 3.7458e+05 3.4238e+05 1.0483e+05 1.1546e+05 1.1105e+05
Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.
transcriptsAnnot
— Имя файла аннотации расшифровки стенограммыИмя файла аннотации расшифровки стенограммы, заданного как строка или вектор символов. Файл может быть GTF или файлом GFF, произведенным cufflinks
, cuffcompare
или другим источником аннотаций GTF.
Пример: "gyrAB.gtf"
Типы данных: char | string
alignmentFiles
— Имена СЭМА, BAM или файлов CXBИмена СЭМА, BAM или файлов CXB, содержащих выравнивание, записывают для каждой выборки, заданной как векторный массив строки или массив ячеек. Если вы используете массив ячеек, каждый элемент должен быть вектором строки или массивом ячеек из символьных векторов, задающим файлы выравнивания для каждого реплицировать той же выборки.
Пример: ["Myco_1_1.sam", "Myco_2_1.sam"]
Типы данных: char
| string
| cell
opt
— опции cuffnorm
CuffNormOptions
| представляет в виде строки | вектор символовОпции cuffnorm
, заданные как объект CuffNormOptions
, строка или вектор символов. Строка или вектор символов должны быть в исходном синтаксисе опции cuffnorm
(снабжены префиксом одним или двумя тире) [1].
Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми.
Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение.
Name
должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.
cuffnorm('gyrAB.gtf',["Myco_1_1.sam", "Myco_2_1.sam"],'NumThreads',5)
'ExtraCommand'
— Дополнительные команды""
(значение по умолчанию) | представляет в виде строки | вектор символовДополнительные команды, заданные как строка или вектор символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразовывает исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.
Пример: 'ExtraCommand','--library-type fr-secondstrand'
Типы данных: char | string
'IncludeAll'
— Отметьте, чтобы применить все доступные параметрыfalse
(значение по умолчанию) | true
Отметьте, чтобы включать все доступные параметры с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, заданный как true
или false
. Исходный синтаксис снабжается префиксом одним или двумя тире, такими как '-d 100 -e 80'
. По умолчанию функция преобразовывает только заданные опции. Если значением является true
, функция преобразовывает все доступные параметры, со значениями по умолчанию для незаданных опций, к исходному синтаксису.
Пример: 'IncludeAll',true
Типы данных: логический
'Labels'
— Метки для выборок[]
(значение по умолчанию) | представляет в виде строки | вектор символов | вектор строки | массив ячеек из символьных векторовМетки для выборок, заданных как строка, вектор символов, представляют в виде строки вектор или массив ячеек из символьных векторов. Если вы обеспечиваете метки, необходимо задать то же количество меток как входные выборки.
Пример:
'Labels',["mutant1","mutant2"]
Типы данных: char
| string
| cell
'LibraryNormalizationMethod'
— Метод, чтобы нормировать размер библиотеки"geometric"
(значение по умолчанию) | "classic-fpkm"
| "quartile"
Метод, чтобы нормировать размер библиотеки, заданный как одна из следующих опций:
"geometric"
— Функция масштабирует значения FPKM средним геометрическим средним значением количеств фрагмента через все библиотеки, как описано в [2].
"classic-fpkm"
— Функция не применяет масштабирования к значениям FPKM или количествам фрагмента.
"quartile"
— Функция масштабирует значения FPKM отношением верхних квартилей между количествами фрагмента и средним значением через все библиотеки.
Пример:
'LibraryNormalizationMethod',"classic-fpkm"
Типы данных: char | string
'NormalizeCompatibleHits'
— Отметьте, чтобы использовать только фрагменты, совместимые со ссылочной расшифровкой стенограммы, чтобы вычислить значения FPKMtrue
(значение по умолчанию) | false
Отметьте, чтобы использовать только фрагменты, совместимые со ссылочной расшифровкой стенограммы, чтобы вычислить значения FPKM, заданные как true
или false
.
Пример: 'NormalizeCompatibleHits',false
Типы данных: логический
'NormalizeTotalHits'
— Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKMfalse
(значение по умолчанию) | true
Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKM, заданные как true
или false
. Если значением является true
, функция включает все фрагменты, включая фрагменты без совместимой ссылки.
Пример: 'NormalizeTotalHits',true
Типы данных: логический
'NumThreads'
— Количество параллельных потоков, чтобы использовать1
(значение по умолчанию) | положительное целое числоКоличество параллельных потоков, чтобы использовать, заданный как положительное целое число. Потоки запущены на отдельных процессорах или ядрах. Увеличение числа потоков обычно значительно улучшает время выполнения, но увеличивает объем потребляемой памяти.
Пример: 'NumThreads',4
Типы данных: double
'OutputDirectory'
— Директория, чтобы сохранить результаты анализа"./"
) (значение по умолчанию) | представляет в виде строки | вектор символовДиректория, чтобы сохранить результаты анализа, заданные как строка или вектор символов.
Пример: 'OutputDirectory',"./AnalysisResults/"
Типы данных: char | string
'OutputFormat'
Формат для файлов результата"simple-table"
(значение по умолчанию) | "cuffdiff"
Формат для файлов результата, заданных как "simple-table"
или "cuffdiff"
.
"simple-table"
— Вывод находится в разграниченном вкладкой формате таблицы.
"cuffdiff"
— Вывод находится в той же форме, используемой cuffdiff
.
Пример:
'OutputFormat',"cuffdiff"
Типы данных: char | string
'Seed'
— Отберите для генератора случайных чисел0
(значение по умолчанию) | неотрицательное целое числоОтберите для генератора случайных чисел, заданного как неотрицательное целое число. Устанавливание значения seed гарантирует воспроизводимость результатов анализа.
Пример: 'Seed',10
Типы данных: double
isoform
— Имя файла, содержащего нормированный уровень экспрессии для изоформы"./isoforms.fpkm_table"
Имя файла, содержащего нормированный уровень экспрессии для каждой изоформы, возвращенной как строка.
Выводимая строка также включает информацию о директории, заданную OutputDirectory
. Значением по умолчанию является текущий каталог. Если вы устанавливаете OutputDirectory
на "/local/tmp/"
, вывод становится "/local/tmp/isoforms.fpkm_table"
.
gene
— Имя файла, содержащего нормированный уровень экспрессии для гена"./genes.fpkm_table"
Имя файла, содержащего нормированный уровень экспрессии для каждого гена, возвращенного как строка.
Выводимая строка также включает информацию о директории, заданную OutputDirectory
. Значением по умолчанию является текущий каталог. Если вы устанавливаете OutputDirectory
на "/local/tmp/"
, вывод становится "/local/tmp/genes.fpkm_table"
.
tss
— Имя файла, содержащего нормированный уровень экспрессии для расшифровки стенограммы, создает сайт"./tss_groups.fpkm_table"
Имя файла, содержащего нормированный уровень экспрессии для каждой расшифровки стенограммы создает сайт (TSS), возвращенной как строка.
Выводимая строка также включает информацию о директории, заданную OutputDirectory
. Значением по умолчанию является текущий каталог. Если вы устанавливаете OutputDirectory
на "/local/tmp/"
, вывод становится "/local/tmp/tss_groups.fpkm_table"
.
cds
— Имя файла, содержащего нормированный уровень экспрессии для кодирования последовательности"./cds.fpkm_table"
Имя файла, содержащего нормированный уровень экспрессии для каждой последовательности кодирования, возвращенной как строка.
Выводимая строка также включает информацию о директории, заданную OutputDirectory
. Значением по умолчанию является текущий каталог. Если вы устанавливаете OutputDirectory
на "/local/tmp/"
, вывод становится "/local/tmp/cds.fpkm_table"
.
[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.