CuffMergeOptions

Опция установлена для cuffmerge

Описание

CuffMergeOptions объект содержит опции для cuffmerge функция, которая объединяет блоки расшифровки стенограммы запонок [1].

Создание

Синтаксис

cuffmergeOpt = CuffMergeOptions

cuffmergeOpt = CuffMergeOptions(Name,Value)

cuffmergeOpt = CuffMergeOptions(S)

Описание

пример

cuffmergeOpt = CuffMergeOptions создает CuffMergeOptions объект со значениями свойств по умолчанию.

CuffMergeOptions требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.

Примечание

CuffMergeOptions поддерживается на Mac и платформах UNIX^® только.

cuffmergeOpt = CuffMergeOptions(Name,Value) устанавливает свойства объектов с помощью одного или нескольких аргументов пары "имя-значение". Заключите каждое имя свойства в кавычки. Например, cuffmergeOpt = CuffMergeOptions('NumThreads',8) задает восемь параллельных потоков.

cuffmergeOpt = CuffMergeOptions(S) задает дополнительные параметры с помощью строки или вектора символов S.

Входные параметры

развернуть все

`S` — `cuffmerge` опции
представьте в виде строки | вектор символов

cuffmerge опции в виде строки или вектора символов. S должен быть в исходном cuffmerge синтаксис опции (снабженный префиксом одним или двумя тире).

Пример: '--num-thread 5'

Свойства

развернуть все

`ExtraCommand` — Дополнительные команды
`""` (значение по умолчанию) | представляет в виде строки | вектор символов

Дополнительные команды в виде строки или вектора символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразует исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.

Пример: '--library-type fr-secondstrand'

Типы данных: char | string

`IncludeAll` — Отметьте, чтобы использовать все свойства объектов
`false` (значение по умолчанию) | `true`

Отметьте, чтобы включать все свойства объектов с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций в виде true или false. Можно преобразовать свойства в исходный синтаксис, снабженный префиксом одним или двумя тире (такими как '-d 100 -e 80') при помощи getCommand. Значение по умолчанию false средние значения это, когда вы вызываете getCommand(optionsObject), это преобразует только заданные свойства. Если значением является true, getCommand преобразует все доступные свойства, со значениями по умолчанию для незаданных свойств, к исходному синтаксису.

Пример: true

Типы данных: логический

`MinIsoformFraction` — Минимальная распространенность изоформы, которая будет включена в объединенный блок
0.5 (значение по умолчанию) | скаляр между `0` и `1`

Минимальная распространенность изоформы, которая будет включена в объединенный блок в виде скаляра между 0 и 1. Это значение выражается как процент самой богатой (главной) изоформы.

Пример: 0.4

Типы данных: double

`NumThreads` — Количество параллельных потоков, чтобы использовать
1 (значение по умолчанию) | положительное целое число

Количество параллельных потоков, чтобы использовать в виде положительного целого числа. Потоки запущены на отдельных процессорах или ядрах. Увеличение числа потоков обычно значительно улучшает время выполнения, но увеличивает объем потребляемой памяти.

Пример 4

Типы данных: double

`OutputDirectory` — Директория, чтобы сохранить результаты анализа
`currentDirectory`) (значение по умолчанию) | представляет в виде строки | вектор символов

Директория, чтобы сохранить результаты анализа в виде строки или вектора символов.

Пример: "./AnalysisResults/"

Типы данных: char | string

`ReferenceGTF` — Имя дополнительного ссылочного файла GTF аннотации
представьте в виде строки | вектор символов

Имя дополнительного ссылочного файла GTF аннотации, который будет включен в объединенный блок в виде строки или вектора символов.

Пример: "ref.gtf"

Типы данных: char | string

`ReferenceSequence` — Имя директории или файла FASTA, содержащего геномные последовательности
представьте в виде строки | вектор символов

Имя директории или файла FASTA, содержащего геномные последовательности ДНК для ссылки в виде строки или вектора символов.

Если вы задаете директорию, она должна содержать один файл FASTA на контиг. Другими словами, директория должна содержать один файл FASTA на ссылочную хромосому, и каждый файл нужно назвать в честь хромосомы и иметь .fa или .fasta расширение.
Если вы задаете файл FASTA, он должен содержать все ссылочные последовательности.

Функция использует обеспеченные последовательности, чтобы улучшить transfrag классификацию и исключить артефакты.

Пример: "allrefs.fasta"

Типы данных: char | string

`Version` — Поддерживаемая версия
строка

Это свойство доступно только для чтения.

Поддерживаемая версия исходного программного обеспечения запонок, возвращенного как строка.

Пример: "2.2.1"

Типы данных: string

Функции объекта

`getCommand`	Переведите свойства объектов в исходный синтаксис опций
`getOptionsTable`	Возвратите таблицу со всеми свойствами и эквивалентные опции в исходном синтаксисе

Примеры

свернуть все

Создайте объект CuffMergeOptions

Создайте CuffMergeOptions объект со значениями по умолчанию.

opt = CuffMergeOptions;

Создайте объект с помощью пар "имя-значение".

opt2 = CuffMergeOptions('OutputDirectory',"./merged",'MinIsoformFraction',0.1)

Создайте объект при помощи исходного синтаксиса.

opt3 = CuffMergeOptions('-o ./merged --min-isoform-fraction 0.1')

Соберите транскриптом и выполните дифференциальное тестирование выражения

Создайте CufflinksOptions объект задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.

cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";

Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения симулированы 100bp-чтения для двух генов (gyrA и gyrB) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks.

sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",...
        "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];

Соберите транскриптом от выровненных чтений.

[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);

gtfs список файлов GTF, которые содержат собранные изоформы.

Сравните собранные изоформы с помощью cuffcompare.

stats = cuffcompare(gtfs);

Объедините собранные расшифровки стенограммы с помощью cuffmerge.

mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');

mergedGTF отчеты только одна расшифровка стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом и cuffmerge не может отличить два отличных гена. Вести cuffmerge, используйте ссылочный GTF (gyrAB.gtf) содержа информацию об этих двух генах. Если файл не расположен в той же директории, что вы запускаете cuffmerge от, необходимо также задать путь к файлу.

gyrAB = which('gyrAB.gtf');
mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',...
			'ReferenceGTF',gyrAB);

Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.

abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                        'OutputDirectory','./cuffquantOutput1');
abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],...
                        'OutputDirectory','./cuffquantOutput2');

Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения тестирования дифференциала с помощью cuffdiff. cuffdiff функция действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant, можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff выполнять статистический анализ. Поскольку cuffdiff возвращает несколько файлов, укажите, что выходная директория рекомендуется.

isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],...
                      'OutputDirectory','./cuffdiffOutput');

Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB и gyrA.

readtable(isoformDiff,'FileType','text')

ans =

  2×14 table

        test_id            gene_id        gene              locus             sample_1    sample_2    status     value_1       value_2      log2_fold_change_    test_stat    p_value    q_value    significant
    ________________    _____________    ______    _______________________    ________    ________    ______    __________    __________    _________________    _________    _______    _______    ___________

    'TCONS_00000001'    'XLOC_000001'    'gyrB'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     1.0913e+05    4.2228e+05          1.9522           7.8886      5e-05      5e-05        'yes'   
    'TCONS_00000002'    'XLOC_000001'    'gyrA'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     3.5158e+05    1.1546e+05         -1.6064          -7.3811      5e-05      5e-05        'yes'

Можно использовать cuffnorm сгенерировать нормированные таблицы выражения для последующих анализов. cuffnorm результаты полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальный анализ выражения с помощью cuffnorm.

Задайте массив ячеек, где каждым элементом является вектор строки, содержащий имена файлов для одной выборки с, реплицирует.

alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                  ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]}
isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,...
                      'OutputDirectory', './cuffnormOutput');

Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.

readtable(isoformNorm,'FileType','text')

ans =

  2×7 table

      tracking_id          q1_0          q1_2          q1_1          q2_1          q2_0          q2_2   
    ________________    __________    __________    __________    __________    __________    __________

    'TCONS_00000001'    1.0913e+05         78628    1.2132e+05    4.3639e+05    4.2228e+05    4.2814e+05
    'TCONS_00000002'    3.5158e+05    3.7458e+05    3.4238e+05    1.0483e+05    1.1546e+05    1.1105e+05

Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.

Ссылки

[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки. Биотехнология природы. 28:511–515.

Документация

CuffMergeOptions

Описание

Создание

Синтаксис

Описание

Примечание

Входные параметры

`S` — `cuffmerge` опции
представьте в виде строки | вектор символов

Свойства

`ExtraCommand` — Дополнительные команды
`""` (значение по умолчанию) | представляет в виде строки | вектор символов

`IncludeAll` — Отметьте, чтобы использовать все свойства объектов
`false` (значение по умолчанию) | `true`

`MinIsoformFraction` — Минимальная распространенность изоформы, которая будет включена в объединенный блок
0.5 (значение по умолчанию) | скаляр между `0` и `1`

`NumThreads` — Количество параллельных потоков, чтобы использовать
1 (значение по умолчанию) | положительное целое число

`OutputDirectory` — Директория, чтобы сохранить результаты анализа
`currentDirectory`) (значение по умолчанию) | представляет в виде строки | вектор символов

`ReferenceGTF` — Имя дополнительного ссылочного файла GTF аннотации
представьте в виде строки | вектор символов

`ReferenceSequence` — Имя директории или файла FASTA, содержащего геномные последовательности
представьте в виде строки | вектор символов

`Version` — Поддерживаемая версия
строка

Функции объекта

Примеры

Создайте объект CuffMergeOptions

Соберите транскриптом и выполните дифференциальное тестирование выражения

Ссылки

Смотрите также

Внешние веб-сайты

Введенный в R2019a

Документация Bioinformatics Toolbox

Поддержка

Документация

CuffMergeOptions

Описание

Создание

Синтаксис

Описание

Примечание

Входные параметры

S — cuffmerge опции представьте в виде строки | вектор символов

Свойства

ExtraCommand — Дополнительные команды "" (значение по умолчанию) | представляет в виде строки | вектор символов

IncludeAll — Отметьте, чтобы использовать все свойства объектов false (значение по умолчанию) | true

MinIsoformFraction — Минимальная распространенность изоформы, которая будет включена в объединенный блок0.5 (значение по умолчанию) | скаляр между 0 и 1

NumThreads — Количество параллельных потоков, чтобы использовать1 (значение по умолчанию) | положительное целое число

OutputDirectory — Директория, чтобы сохранить результаты анализа currentDirectory) (значение по умолчанию) | представляет в виде строки | вектор символов

ReferenceGTF — Имя дополнительного ссылочного файла GTF аннотации представьте в виде строки | вектор символов

ReferenceSequence — Имя директории или файла FASTA, содержащего геномные последовательности представьте в виде строки | вектор символов

Version — Поддерживаемая версия строка

Функции объекта

Примеры

Создайте объект CuffMergeOptions

Соберите транскриптом и выполните дифференциальное тестирование выражения

Ссылки

Смотрите также

Внешние веб-сайты

Введенный в R2019a

Документация Bioinformatics Toolbox

Поддержка

`S` — `cuffmerge` опции
представьте в виде строки | вектор символов

`ExtraCommand` — Дополнительные команды
`""` (значение по умолчанию) | представляет в виде строки | вектор символов

`IncludeAll` — Отметьте, чтобы использовать все свойства объектов
`false` (значение по умолчанию) | `true`

`MinIsoformFraction` — Минимальная распространенность изоформы, которая будет включена в объединенный блок
0.5 (значение по умолчанию) | скаляр между `0` и `1`

`NumThreads` — Количество параллельных потоков, чтобы использовать
1 (значение по умолчанию) | положительное целое число

`OutputDirectory` — Директория, чтобы сохранить результаты анализа
`currentDirectory`) (значение по умолчанию) | представляет в виде строки | вектор символов

`ReferenceGTF` — Имя дополнительного ссылочного файла GTF аннотации
представьте в виде строки | вектор символов

`ReferenceSequence` — Имя директории или файла FASTA, содержащего геномные последовательности
представьте в виде строки | вектор символов

`Version` — Поддерживаемая версия
строка