CuffMergeOptions

Набор опций для cuffmerge

развернуть все на странице

Описание

A CuffMergeOptions содержит параметры для cuffmerge функция, объединяющая сборки транскриптов запонок [1].

Создание

Синтаксис

cuffmergeOpt = CuffMergeOptions

cuffmergeOpt = CuffMergeOptions (имя, значение)

cuffmergeOpt = CuffMergeOptions (S)

Описание

пример

cuffmergeOpt = CuffMergeOptions создает CuffMergeOptions со значениями свойств по умолчанию.

CuffMergeOptions требуется пакет поддержки «Запонки» для Toolbox™ биоинформатики. Если пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.

Примечание

CuffMergeOptions поддерживается только на платформах Mac и UNIX ®.

cuffmergeOpt = CuffMergeOptions(Name,Value) задает свойства объекта, используя один или несколько аргументов пары имя-значение. Заключите каждое имя свойства в кавычки. Например, cuffmergeOpt = CuffMergeOptions('NumThreads',8) задает восемь параллельных потоков.

cuffmergeOpt = CuffMergeOptions(S) задание дополнительных параметров с использованием вектора строки или символа S.

Входные аргументы

развернуть все

`S` — `cuffmerge` варианты
строка | символьный вектор

cuffmerge параметры, заданные как строковый или символьный вектор. S должен быть в оригинале cuffmerge синтаксис опции (префикс одним или двумя тире).

Пример: '--num-thread 5'

Свойства

развернуть все

`ExtraCommand` - Дополнительные команды
`""` (по умолчанию) | строка | символьный вектор

Команды должны иметь собственный синтаксис (префикс одного или двух тире). Эта опция используется для применения флагов и флагов без документов без соответствующих свойств MATLAB ^®.

Когда программа преобразует исходные флаги в свойства MATLAB, она сохраняет все нераспознанные флаги в этом свойстве.

Пример: '--library-type fr-secondstrand'

Типы данных: char | string

`IncludeAll` - Флаг для использования всех свойств объекта
`false` (по умолчанию) | `true`

Флажок для включения всех свойств объекта с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, указанный как true или false. Свойства можно преобразовать в исходный синтаксис с помощью одного или двух тире (например, '-d 100 -e 80') с помощью getCommand. Значение по умолчанию false означает, что при звонке getCommand(optionsObject), он преобразует только указанные свойства. Если значение равно true, getCommand преобразует все доступные свойства с значениями по умолчанию для неопределенных свойств в исходный синтаксис.

Примечание

Если установить IncludeAll кому true, программа преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что если значением по умолчанию свойства является NaN, Inf, [], '', или "", то программное обеспечение не переводит соответствующее свойство.

Пример: true

Типы данных: logical

`MinIsoformFraction` - Минимальное количество изоформы, включаемое в объединенную сборку
`0.5` (по умолчанию) | скаляр между `0` и `1`

Минимальное количество изоформы, включаемое в объединенную сборку, указанное как скаляр между 0 и 1. Это значение выражается в процентах от наиболее распространенной (основной) изоформы.

Пример: 0.4

Типы данных: double

`NumThreads` - Количество параллельных потоков для использования
`1` (по умолчанию) | положительное целое число

Число параллельных потоков для использования, указанное как положительное целое число. Потоки выполняются на отдельных процессорах или ядрах. Увеличение количества потоков, как правило, значительно улучшает время выполнения, но увеличивает объем памяти.

Пример: 4

Типы данных: double

`OutputDirectory` - Каталог для хранения результатов анализа
текущий каталог (`"./"`) (по умолчанию) | строка | символьный вектор

Каталог для хранения результатов анализа, указанный как строковый или символьный вектор.

Пример: "./AnalysisResults/"

Типы данных: char | string

`ReferenceGTF` - Имя необязательного файла аннотации ссылки GTF
строка | символьный вектор

Имя необязательного файла аннотации ссылки GTF для включения в комбинированную сборку, определяемое как вектор строки или символа.

Пример: "ref.gtf"

Типы данных: char | string

`ReferenceSequence` - Имя каталога или файла FASTA, содержащего геномные последовательности
строка | символьный вектор

Имя каталога или файла FASTA, содержащего последовательности геномной ДНК для ссылки, указанного как строковый или символьный вектор.

Если указан каталог, он должен содержать один файл FASTA на контиг. Другими словами, каталог должен содержать один файл FASTA на эталонную хромосому, и каждый файл должен быть назван в честь хромосомы и иметь .fa или .fasta расширение.
Если указан файл FASTA, он должен содержать все ссылочные последовательности.

Функция использует предоставленные последовательности для улучшения классификации передачи и исключения артефактов.

Пример: "allrefs.fasta"

Типы данных: char | string

`Version` - Поддерживаемая версия
последовательность

Это свойство доступно только для чтения.

Поддерживаемая версия программного обеспечения оригинальных запонок, возвращаемая в виде строки.

Пример: "2.2.1"

Типы данных: string

Функции объекта

`getCommand`	Преобразовать свойства объекта в исходный синтаксис параметров
`getOptionsTable`	Возвращать таблицу со всеми свойствами и эквивалентными параметрами в исходном синтаксисе

Примеры

свернуть все

Создать объект CuffMergeOptions

Создать CuffMergeOptions со значениями по умолчанию.

opt = CuffMergeOptions;

Создайте объект, используя пары имя-значение.

opt2 = CuffMergeOptions('OutputDirectory',"./merged",'MinIsoformFraction',0.1)

Создайте объект с помощью исходного синтаксиса.

opt3 = CuffMergeOptions('-o ./merged --min-isoform-fraction 0.1')

Сборка транскриптома и выполнение дифференциального тестирования экспрессии

Создать CufflinksOptions объект для определения параметров cfflinks, таких как количество параллельных потоков и папка вывода для хранения результатов.

cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";

Файлы SAM, представленные в этом примере, содержат выровненные чтения для Mycoplasma pneumoniae из двух образцов с тремя репликациями каждый. Считывание моделируется 100 bp для двух генов (gyrA и gyrB) расположены рядом друг с другом на геноме. Все операции чтения сортируются по ссылочному положению, как требуется cufflinks.

sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",...
        "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];

Соберите транскриптом из выровненных считываний.

[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);

gtfs - список GTF-файлов, содержащих собранные изоформы.

Сравнение собранных изоформ с помощью cuffcompare.

stats = cuffcompare(gtfs);

Объединить собранные стенограммы с помощью cuffmerge.

mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');

mergedGTF сообщает только одну стенограмму. Это потому, что два интересующих гена расположены рядом друг с другом, и cuffmerge не может различить два различных гена. Вести cuffmerge, использовать эталонный GTF (gyrAB.gtf), содержащий информацию об этих двух генах. Если файл находится не в том же каталоге, в котором выполняется cuffmerge из, необходимо также указать путь к файлу.

gyrAB = which('gyrAB.gtf');
mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',...
			'ReferenceGTF',gyrAB);

Рассчитайте плотность (уровни выражений) на основе выровненных чтений для каждого образца.

abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                        'OutputDirectory','./cuffquantOutput1');
abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],...
                        'OutputDirectory','./cuffquantOutput2');

Оцените значимость изменений в экспрессии генов и транскриптов между состояниями, выполнив дифференциальное тестирование с использованием cuffdiff. cuffdiff функция работает в два отдельных шага: функция сначала оценивает изобилие из выровненных считываний, а затем выполняет статистический анализ. В некоторых случаях (например, распределение вычислительной нагрузки между несколькими работниками) выполнение этих двух шагов по отдельности является желательным. После выполнения первого шага с cuffquant, затем можно использовать двоичный выходной файл CXB в качестве входных данных для cuffdiff для выполнения статистического анализа. Поскольку cuffdiff возвращает несколько файлов, укажите рекомендуемый выходной каталог.

isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],...
                      'OutputDirectory','./cuffdiffOutput');

Отображение таблицы, содержащей результаты теста дифференциальной экспрессии для двух генов gyrB и gyrA.

readtable(isoformDiff,'FileType','text')

ans =

  2×14 table

        test_id            gene_id        gene              locus             sample_1    sample_2    status     value_1       value_2      log2_fold_change_    test_stat    p_value    q_value    significant
    ________________    _____________    ______    _______________________    ________    ________    ______    __________    __________    _________________    _________    _______    _______    ___________

    'TCONS_00000001'    'XLOC_000001'    'gyrB'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     1.0913e+05    4.2228e+05          1.9522           7.8886      5e-05      5e-05        'yes'   
    'TCONS_00000002'    'XLOC_000001'    'gyrA'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     3.5158e+05    1.1546e+05         -1.6064          -7.3811      5e-05      5e-05        'yes'

Вы можете использовать cuffnorm для создания нормализованных таблиц выражений для дальнейшего анализа. cuffnorm результаты полезны, когда у вас есть много образцов, и вы хотите сгруппировать их или построить график уровней экспрессии для генов, которые важны в вашем исследовании. Обратите внимание, что невозможно выполнить дифференциальный анализ выражений с помощью cuffnorm.

Укажите массив ячеек, где каждый элемент является строковым вектором, содержащим имена файлов для одного образца с репликациями.

alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                  ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]}
isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,...
                      'OutputDirectory', './cuffnormOutput');

Отображение таблицы, содержащей нормализованные уровни выражений для каждого транскрипта.

readtable(isoformNorm,'FileType','text')

ans =

  2×7 table

      tracking_id          q1_0          q1_2          q1_1          q2_1          q2_0          q2_2   
    ________________    __________    __________    __________    __________    __________    __________

    'TCONS_00000001'    1.0913e+05         78628    1.2132e+05    4.3639e+05    4.2228e+05    4.2814e+05
    'TCONS_00000002'    3.5158e+05    3.7458e+05    3.4238e+05    1.0483e+05    1.1546e+05    1.1105e+05

Имена столбцов, начинающиеся с q, имеют формат conditionX_N, указывающий, что столбец содержит значения для репликации N условия X.

Ссылки

[1] Трапнелл, Коул, Брайан А Уильямс, Гео Пертеа, Али Мортазави, Гордон Кван, Марике Дж. ван Барен, Стивен Л Зальцберг, Барбара Дж. Уолд и Лиор Пэхтер. «Сборка и количественная оценка транскриптов с помощью РНК-Seq выявляет необъявленные транскрипты и переключение изоформ во время дифференцировки клеток». Биотехнология природы 28, № 5 (май 2010 года): 511-15.

См. также

Темы

Пакеты поддержки ПО инструментария для биоинформатики

Внешние веб-сайты

Манжеты вручную

Представлен в R2019a

Документация

CuffMergeOptions

Описание

Создание

Синтаксис

Описание

Входные аргументы

`S` — `cuffmerge` варианты
строка | символьный вектор

Свойства

`ExtraCommand` - Дополнительные команды
`""` (по умолчанию) | строка | символьный вектор

`IncludeAll` - Флаг для использования всех свойств объекта
`false` (по умолчанию) | `true`

`MinIsoformFraction` - Минимальное количество изоформы, включаемое в объединенную сборку
`0.5` (по умолчанию) | скаляр между `0` и `1`

`NumThreads` - Количество параллельных потоков для использования
`1` (по умолчанию) | положительное целое число

`OutputDirectory` - Каталог для хранения результатов анализа
текущий каталог (`"./"`) (по умолчанию) | строка | символьный вектор

`ReferenceGTF` - Имя необязательного файла аннотации ссылки GTF
строка | символьный вектор

`ReferenceSequence` - Имя каталога или файла FASTA, содержащего геномные последовательности
строка | символьный вектор

`Version` - Поддерживаемая версия
последовательность

Функции объекта

Примеры

Создать объект CuffMergeOptions

Сборка транскриптома и выполнение дифференциального тестирования экспрессии

Ссылки

См. также

Темы

Внешние веб-сайты

Документация по инструментарию биоинформатики

Поддержка

Документация

CuffMergeOptions

Описание

Создание

Синтаксис

Описание

Входные аргументы

S — cuffmerge варианты строка | символьный вектор

Свойства

ExtraCommand - Дополнительные команды "" (по умолчанию) | строка | символьный вектор

IncludeAll - Флаг для использования всех свойств объекта false (по умолчанию) | true

MinIsoformFraction - Минимальное количество изоформы, включаемое в объединенную сборку 0.5 (по умолчанию) | скаляр между 0 и 1

NumThreads - Количество параллельных потоков для использования 1 (по умолчанию) | положительное целое число

OutputDirectory - Каталог для хранения результатов анализа текущий каталог ("./") (по умолчанию) | строка | символьный вектор

ReferenceGTF - Имя необязательного файла аннотации ссылки GTF строка | символьный вектор

ReferenceSequence - Имя каталога или файла FASTA, содержащего геномные последовательности строка | символьный вектор

Version - Поддерживаемая версия последовательность

Функции объекта

Примеры

Создать объект CuffMergeOptions

Сборка транскриптома и выполнение дифференциального тестирования экспрессии

Ссылки

См. также

Темы

Внешние веб-сайты

Документация по инструментарию биоинформатики

Поддержка

`S` — `cuffmerge` варианты
строка | символьный вектор

`ExtraCommand` - Дополнительные команды
`""` (по умолчанию) | строка | символьный вектор

`IncludeAll` - Флаг для использования всех свойств объекта
`false` (по умолчанию) | `true`

`MinIsoformFraction` - Минимальное количество изоформы, включаемое в объединенную сборку
`0.5` (по умолчанию) | скаляр между `0` и `1`

`NumThreads` - Количество параллельных потоков для использования
`1` (по умолчанию) | положительное целое число

`OutputDirectory` - Каталог для хранения результатов анализа
текущий каталог (`"./"`) (по умолчанию) | строка | символьный вектор

`ReferenceGTF` - Имя необязательного файла аннотации ссылки GTF
строка | символьный вектор

`ReferenceSequence` - Имя каталога или файла FASTA, содержащего геномные последовательности
строка | символьный вектор

`Version` - Поддерживаемая версия
последовательность