CuffCompareOptions

Опция установлена для cuffcompare

Описание

Объект CuffCompareOptions задает опции для функции cuffcompare, которая сравнивает собранные расшифровки стенограммы через несколько экспериментов [1].

Создание

Синтаксис

cuffcompareOpt = CuffCompareOptions
cuffcompareOpt = CuffCompareOptions(Name,Value)
cuffcompareOpt = CuffCompareOptions(S)

Описание

пример

cuffcompareOpt = CuffCompareOptions создает объект CuffCompareOptions со значениями свойств по умолчанию.

CuffCompareOptions требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.

Примечание

CuffCompareOptions поддерживается на Mac и платформах UNIX® только.

cuffcompareOpt = CuffCompareOptions(Name,Value) устанавливает свойства объектов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, cuffcompareOpt = CuffCompareOptions('SupressMapFiles',true) предотвращает создание файлов .refmap и .tmap.

cuffcompareOpt = CuffCompareOptions(S) задает дополнительные параметры с помощью строки или вектора символов S.

Входные параметры

развернуть все

Опции cuffcompare, заданные как строка или вектор символов. S должен быть в исходном синтаксисе опции cuffcompare (снабжен префиксом одним или двумя тире).

Пример: '-d 100 -e 80'

Свойства

развернуть все

Префикс для расшифровки стенограммы согласия называет в файле вывода combined.gtf, заданном как строка или вектор символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.

Пример: "consensusTs"

Типы данных: char | string

Отметьте, чтобы проигнорировать избыточный интроном transfrags, если у них есть те же 5' концов, но различные 3' конца, заданные как true или false.

Пример: true

Типы данных: логический

Отметьте, чтобы отбросить одно экзон transfrags и ссылочные расшифровки стенограммы, заданные как true или false.

Пример: true

Типы данных: логический

Отметьте, чтобы отбросить расшифровки стенограммы ссылки одно экзона, заданные как true или false.

Пример: true

Типы данных: логический

Дополнительные команды, заданные как строка или вектор символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразовывает исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.

Пример: "--library-type fr-secondstrand"

Типы данных: char | string

Имя текстового файла, содержащего список файлов GTF к процессу, заданному как строка или вектор символов. Файл должен содержать один путь к файлу GTF на строку. Можно использовать эту опцию в качестве альтернативы передаче массива имен файлов к cuffcompare.

Пример: "gtfManifestFile.txt"

Типы данных: char | string

Отметьте, чтобы обработать файлы входа GTF как файлы GFF, заданные как true или false. Используйте эту опцию, когда файлы входа GFF или GTF не будут произведены cufflinks.

Пример: true

Типы данных: логический

Отметьте, чтобы включать все свойства объектов с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, заданный как true или false. Можно преобразовать свойства в исходный синтаксис, снабженный префиксом одним или двумя тире (такими как '-d 100 -e 80') при помощи getCommand. false значения по умолчанию означает, что, когда вы вызываете getCommand(optionsObject), он преобразовывает только заданные свойства. Если значением является true, getCommand преобразовывает все доступные свойства, со значениями по умолчанию для незаданных свойств, к исходному синтаксису.

Пример: true

Типы данных: логический

Отметьте, чтобы включать transfrags, содержавший в другом transfrags в том же местоположении в выводе combined.gtf, заданном как true или false. По умолчанию cuffcompare не включает, они содержали transfrags. Если значением является true, содержавшие transfrags включают атрибут contained_in, указывающий на первый контейнер transfrag найденный.

Пример: true

Типы данных: логический

Количество основ от свободных концов терминальных экзонов, чтобы использовать при оценке точности экзона, заданной как положительное целое число.

Пример: 80

Типы данных: double

Количество основ, чтобы использовать для группировки расшифровки стенограммы создает сайты, заданные как положительное целое число.

Пример: 90

Типы данных: double

Префикс для выходных файлов cuffcompare, заданных как строка или вектор символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.

Пример: "cuffcompareOut"

Типы данных: char | string

Имя GTF или файла GFF, содержащего ссылочные расшифровки стенограммы, чтобы выдержать сравнение с каждой выборкой, заданной как строка или вектор символов. Если вы обеспечиваете файл, функция сравнивает каждую выборку со ссылками в файле и отмечает изоформы как overlapping, matching или novel. Функция хранит эти теги в выходных файлах файлы .tmap и .refmap.

Пример: "references.gtf"

Типы данных: char | string

Имя директории, содержащей последовательности FASTA, чтобы классифицировать входные расшифровки стенограммы как повторения, заданные как строка или вектор символов. Директория должна содержать FASTA-файлы-формата с базовыми геномными последовательностями и содержать один файл FASTA на ссылку. Назовите каждый файл FASTA в честь хромосомы с дополнительным .fa или .fasta.

Пример: "./SequenceDirectory/"

Типы данных: char | string

Отметьте, чтобы рассмотреть только ссылочные расшифровки стенограммы, которые накладываются с любым входом transfrags, заданный как true или false. Если значением является true:

  • Функция игнорирует любые ссылочные расшифровки стенограммы, которые не накладываются ни с одним входом transfrags.

  • Необходимо также задать опцию ReferenceGTF.

Пример: true

Типы данных: логический

Отметьте, чтобы рассмотреть только входные расшифровки стенограммы, которые накладываются с любой из ссылочных расшифровок стенограммы, заданных как true или false. Если значением является true:

  • Функция игнорирует любые входные расшифровки стенограммы, которые не накладываются ни с одной из ссылочных расшифровок стенограммы, и не сообщает ни о каких новых местах.

  • Необходимо также задать опцию ReferenceGTF.

Пример: true

Типы данных: логический

Отметьте, чтобы предотвратить создание .tmap и файлов .refmap, заданных как true или false. Установите значение к true, чтобы препятствовать тому, чтобы функция генерировала файлы.

Пример: true

Типы данных: логический

Это свойство доступно только для чтения.

Поддерживаемая версия исходного программного обеспечения запонок, возвращенного как строка.

Пример: "2.2.1"

Типы данных: string

Функции объекта

getCommandПереведите свойства объектов в исходный синтаксис опций
getOptionsTableВозвратите таблицу со всеми свойствами и эквивалентные опции в исходном синтаксисе

Примеры

свернуть все

Создайте объект CuffCompareOptions со значениями по умолчанию.

opt = CuffCompareOptions;

Создайте объект с помощью пар "имя-значение".

opt2 = CuffCompareOptions('GenericGFF',true,'MaxAccuracyRange',80)

Создайте объект с помощью исходного синтаксиса.

opt3 = CuffCompareOptions('-d 100 -e 80')

Создайте объект CufflinksOptions задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.

cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";

Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения моделируются 100bp-чтения для двух генов (gyrA и gyrB) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks.

sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",...
        "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];

Соберите транскриптом от выровненных чтений.

[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);

gtfs является списком файлов GTF, которые содержат собранные изоформы.

Сравните собранные изоформы с помощью cuffcompare.

stats = cuffcompare(gtfs);

Объедините собранные расшифровки стенограммы с помощью cuffmerge.

mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');

mergedGTF сообщает о только одной расшифровке стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом, и cuffmerge не может отличить два отличных гена. Чтобы вести cuffmerge, используйте ссылочный GTF (gyrAB.gtf), содержащий информацию об этих двух генах. Если файл не расположен в той же директории, от которой вы запускаете cuffmerge, необходимо также задать путь к файлу.

gyrAB = which('gyrAB.gtf');
mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',...
			'ReferenceGTF',gyrAB);

Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.

abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                        'OutputDirectory','./cuffquantOutput1');
abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],...
                        'OutputDirectory','./cuffquantOutput2');

Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения тестирования дифференциала с помощью cuffdiff. Функция cuffdiff действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff, чтобы выполнить статистический анализ. Поскольку cuffdiff возвращает несколько файлов, укажите, что выходная директория рекомендуется.

isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],...
                      'OutputDirectory','./cuffdiffOutput');

Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB и gyrA.

readtable(isoformDiff,'FileType','text')
ans =

  2×14 table

        test_id            gene_id        gene              locus             sample_1    sample_2    status     value_1       value_2      log2_fold_change_    test_stat    p_value    q_value    significant
    ________________    _____________    ______    _______________________    ________    ________    ______    __________    __________    _________________    _________    _______    _______    ___________

    'TCONS_00000001'    'XLOC_000001'    'gyrB'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     1.0913e+05    4.2228e+05          1.9522           7.8886      5e-05      5e-05        'yes'   
    'TCONS_00000002'    'XLOC_000001'    'gyrA'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     3.5158e+05    1.1546e+05         -1.6064          -7.3811      5e-05      5e-05        'yes'   

Можно использовать cuffnorm, чтобы сгенерировать нормированные таблицы выражения для последующих анализов. результаты cuffnorm полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальный анализ выражения с помощью cuffnorm.

Задайте массив ячеек, где каждый элемент является вектором строки, содержащим имена файлов для одной выборки с, реплицирует.

alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                  ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]}
isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,...
                      'OutputDirectory', './cuffnormOutput');

Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.

readtable(isoformNorm,'FileType','text')
ans =

  2×7 table

      tracking_id          q1_0          q1_2          q1_1          q2_1          q2_0          q2_2   
    ________________    __________    __________    __________    __________    __________    __________

    'TCONS_00000001'    1.0913e+05         78628    1.2132e+05    4.3639e+05    4.2228e+05    4.2814e+05
    'TCONS_00000002'    3.5158e+05    3.7458e+05    3.4238e+05    1.0483e+05    1.1546e+05    1.1105e+05

Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.

Ссылки

[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки. Биотехнология природы. 28:511–515.

Смотрите также

|

Внешние веб-сайты

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте