CuffDiffOptions

Набор опций для cuffdiff

Описание

A CuffDiffOptions объект задает параметры для cuffdiff функция, которая идентифицирует значительные изменения в выражении транскрипта [1].

Создание

Синтаксис

cuffdiffOpt = CuffDiffOptions

cuffdiffOpt = CuffDiffOptions (имя, значение)

cuffdiffOpt = CuffDiffOptions (S)

Описание

пример

cuffdiffOpt = CuffDiffOptions создает CuffDiffOptions со значениями свойств по умолчанию.

CuffDiffOptions требуется пакет поддержки «Запонки» для Toolbox™ биоинформатики. Если пакет поддержки не установлен, функция предоставляет ссылку для загрузки. Дополнительные сведения см. в разделе Пакеты поддержки ПО для панели инструментов биоинформатики.

Примечание

CuffDiffOptions поддерживается только на платформах Mac и UNIX ®.

cuffdiffOpt = CuffDiffOptions(Name,Value) задает свойства объекта, используя один или несколько аргументов пары имя-значение. Заключите каждое имя свойства в кавычки. Например, cuffdiffOpt = CuffDiffOptions('SupressMapFiles',true) предотвращает создание .tmap и .refmap файлы.

cuffdiffOpt = CuffDiffOptions(S) задание дополнительных параметров с использованием вектора строки или символа S.

Входные аргументы

развернуть все

`S` — `cuffdiff` варианты
строка | символьный вектор

cuffdiff параметры, заданные как строковый или символьный вектор. S должен быть в оригинале cuffdiff синтаксис опции (префикс одним или двумя тире).

Пример: '--seed 5'

Свойства

развернуть все

`ConditionLabels` - Образцы этикеток
строка | строковый вектор | символьный вектор | массив ячеек символьного вектора

Образцы меток, указанные как строка, строковый вектор, символьный вектор или массив ячеек символьных векторов. Количество меток должно совпадать с количеством образцов, или значение должно быть пустым [].

Пример: ["Control","Mutant1","Mutant2"]

Типы данных: string | char | cell

`ContrastFile` - Имя контрастного файла
строка | символьный вектор

Имя файла контрастности, указанное как строковый или символьный вектор. Файл должен быть текстовым файлом с разделителями табуляции из двух столбцов, где каждая строка указывает два условия для сравнения с помощью cuffdiff. Метки условий в файле должны соответствовать меткам, указанным для ConditionLabels или имена образцов. Файл должен иметь одну строку заголовка в качестве первой строки, за которой должна следовать одна строка для каждого контраста. Ниже приведен пример формата файла контрастности.

condition_A	condition_B
Контроль	Mutant1
Контроль	Mutant2

Если вы не предоставите этот файл, cuffdiff сравнивает каждую пару условий ввода, которые могут повлиять на производительность.

Пример: "contrast.txt"

Типы данных: char | string

`DispersionMethod` - Метод моделирования дисперсии в количестве фрагментов
`"pooled"` (по умолчанию) | `"per-condition"` | `"blind"` | `"poisson"`

Метод моделирования дисперсии в счетчиках фрагментов по репликам, указанный как один из следующих параметров:

"pooled" - Функция использует каждое реплицированное условие для построения модели и усредняет эти модели в глобальную модель для всех условий в эксперименте.
"per-condition" - функция создает модель для каждого условия. Этот параметр можно использовать только в том случае, если все условия имеют репликацию.
"blind" - Функция рассматривает все образцы как копии одного глобального распределения и создает одну модель.
"poisson" - Дисперсия в подсчетах фрагментов является моделью отравления, где количество фрагментов прогнозируется как среднее по репликам. Этот метод не рекомендуется.

Выберите метод в зависимости от того, должна ли изменчивость в каждой группе образцов быть одинаковой.

При сравнении двух групп, где первая группа имеет низкую вариабельность перекрестной репликации, а вторая группа имеет высокую изменчивость, выберите per-condition способ.
Если условия имеют аналогичные уровни изменчивости, выберите pooled способ.
Если в каждом условии имеется только одна репликация, выберите blind способ.

Пример: "blind"

Типы данных: char | string

`DoIsoformSwitch` - Флаг для выполнения тестов на переключение изоформ
`true` (по умолчанию) | `false`

Флаг для выполнения тестов переключения изоформ, указанный как true или false. Эти тесты оценивают, сколько дифференциального сплайсинга существует в изоформах из одного первичного транскрипта. По умолчанию используется значение true и результаты теста сохраняются в выходном файле. splicing.diff.

Пример: false

Типы данных: logical

`EffectiveLengthCorrection` - Флаг для нормализации количества фрагментов
`true` (по умолчанию) | `false`

Флаг для нормализации количества фрагментов к фрагментам на килобазу на миллион отображенных операций чтения (FPKM), указанный как true или false.

Пример: false

Типы данных: logical

`ExtraCommand` - Дополнительные команды
`""` (по умолчанию) | строка | символьный вектор

Команды должны иметь собственный синтаксис (префикс одного или двух тире). Эта опция используется для применения флагов и флагов без документов без соответствующих свойств MATLAB ^®.

Когда программа преобразует исходные флаги в свойства MATLAB, она сохраняет все нераспознанные флаги в этом свойстве.

Пример: '--library-type fr-secondstrand'

Типы данных: char | string

`FalseDiscoveryRate` - Частота ложных обнаружений
`0.05` (по умолчанию) | скаляр между `0` и `1`

Частота ложного обнаружения, используемая во время статистических тестов, заданная как скаляр между 0 и 1.

Пример: 0.01

Типы данных: double

`FragmentBiasCorrection` - Имя файла FASTA со ссылочными транскриптами для обнаружения смещения
строка | символьный вектор

Имя файла FASTA со ссылочными транскриптами для обнаружения смещения в подсчетах фрагментов, указанных как строковый или символьный вектор. Библиотечный препарат может вводить последовательность-специфическое смещение в эксперименты РНК-Seq. Предоставление эталонных транскриптов повышает точность оценок численности транскриптов.

Пример: "bias.fasta"

Типы данных: char | string

`FragmentLengthMean` - Ожидаемая средняя длина фрагмента в парах оснований
`200` (по умолчанию) | положительное целое число

Ожидаемая средняя длина фрагмента, заданная как положительное целое число. Значение по умолчанию: 200 базовые пары. Функция может узнать среднее значение длины фрагмента для каждого файла SAM. Использование этого параметра не рекомендуется для парных операций чтения.

Пример: 100

Типы данных: double

`FragmentLengthSD` - Ожидаемое стандартное отклонение для распределения длины фрагмента
`80` (по умолчанию) | положительный скаляр

Ожидаемое стандартное отклонение для распределения длины фрагмента, указанное как положительный скаляр. Значение по умолчанию: 80 базовые пары. Функция может узнать стандартное отклонение длины фрагмента для каждого файла SAM. Использование этого параметра не рекомендуется для парных операций чтения.

Пример: 70

Типы данных: double

`GenerateAnalysisDiff` - Флажок для создания файлов дифференциального анализа
`true` (по умолчанию) | `false`

Флажок для создания файлов дифференциального анализа (*.diff), указано как true или false.

Пример: false

Типы данных: logical

`IncludeAll` - Флаг для использования всех свойств объекта
`false` (по умолчанию) | `true`

Флажок для включения всех свойств объекта с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, указанный как true или false. Свойства можно преобразовать в исходный синтаксис с помощью одного или двух тире (например, '-d 100 -e 80') с помощью getCommand. Значение по умолчанию false означает, что при звонке getCommand(optionsObject), он преобразует только указанные свойства. Если значение равно true, getCommand преобразует все доступные свойства с значениями по умолчанию для неопределенных свойств в исходный синтаксис.

Примечание

Если установить IncludeAll кому true, программа преобразует все доступные свойства со значениями по умолчанию для неопределенных свойств. Единственным исключением является то, что если значением по умолчанию свойства является NaN, Inf, [], '', или "", то программное обеспечение не переводит соответствующее свойство.

Пример: true

Типы данных: logical

`IsoformShiftReplicates` - Минимальное количество реплик для тестирования генов на дифференциальную регуляцию
`3` (по умолчанию) | положительное целое число

Минимальное количество реплик для тестирования генов на дифференциальную регуляцию, указанное как положительное целое число. Функция пропускает тесты, когда число репликаций меньше указанного значения.

Пример: 2

Типы данных: double

`LengthCorrection` - Флаг для исправления по длине стенограммы
`true` (по умолчанию) | `false`

Флаг для исправления по длине транскрипта, указанный как true или false. Задайте для этого значения значение false только когда количество фрагментов не зависит от размера признаков, например, для небольших библиотек РНК без фрагментации и для 3 '-концевого секвенирования, где все фрагменты имеют одинаковую длину.

Пример: false

Типы данных: logical

`LibraryNormalizationMethod` - Метод нормализации размера библиотеки
`"geometric"` (по умолчанию) | `"classic-fpkm"` | `"quartile"`

Метод нормализации размера библиотеки, указанный как один из следующих параметров.

"geometric" - Функция масштабирует значения FPKM на среднее среднее геометрическое количества фрагментов во всех библиотеках, как описано в [2].
"classic-fpkm" - Функция не применяет масштабирование к значениям FPKM или подсчетам фрагментов.
"quartile" - функция масштабирует значения FPKM по соотношению верхних квартилей между количеством фрагментов и средним значением по всем библиотекам.

Пример: "classic-fpkm"

Типы данных: char | string

`MaskFile` - Имя файла GTF или GFF, содержащего транскрипты для игнорирования
строка | символьный вектор

Имя файла GTF или GFF, содержащего транскрипты, игнорируемые при анализе, указанное как строковый или символьный вектор. Некоторые примеры транскриптов, которые следует игнорировать, включают аннотированные транскрипты рРНК, митохондриальные транскрипты и другие обильные транскрипты. Игнорирование этих транскриптов улучшает надежность оценок изобилия.

Пример: "excludes.gtf"

Типы данных: char | string

`MaxBundleFrags` - Максимальное количество фрагментов, включаемых для каждого локуса перед пропуском
`500000` (по умолчанию) | положительное целое число

Максимальное количество фрагментов, включаемых для каждого локуса перед пропуском новых фрагментов, указанное как положительное целое число. Пропущенные фрагменты помечаются статусом HIDATA в файле skipped.gtf.

Пример: 400000

Типы данных: double

`MaxFragAlignments` - Максимальное количество выровненных чтений, включаемых для каждого фрагмента
`Inf` (по умолчанию) | положительное целое число

Максимальное число выровненных операций чтения, включаемых для каждого фрагмента перед пропуском новых операций чтения, указанное как положительное целое число. Inf, значение по умолчанию, не устанавливает ограничения на максимальное количество выровненных чтений.

Пример: 1000

Типы данных: double

`MaxMLEIterations` - Максимальное количество итераций для оценки максимального правдоподобия
`5000` (по умолчанию) | положительное целое число

Максимальное число итераций для оценки максимального правдоподобия изобилия, указанное как положительное целое число.

Пример: 4000

Типы данных: double

`MinAlignmentCount` - Минимальное количество трасс, необходимых в локусе для проверки значимости
`10` (по умолчанию) | положительное целое число

Минимальное количество выравниваний, необходимое в локусе для выполнения проверки значимости различий между выборками, указанное как положительное целое число.

Пример: 8

Типы данных: double

`MinIsoformFraction` - Минимальное количество изоформы, включаемое в тесты дифференциальной экспрессии
`1e-5` (по умолчанию) | скаляр между `0` и `1`

Минимальная плотность изоформы для включения в тесты дифференциального выражения, заданная как скаляр между 0 и 1. Для альтернативных изоформ, количественно определяемых ниже указанного значения, функция округляет изобилие до нуля. Указанное значение является долей основной изоформы. Функция выполняет эту фильтрацию после оценки MLE, но до оценки MAP, чтобы улучшить надежность генерации доверительного интервала и анализа дифференциальной экспрессии. Использование значения параметра, отличного от значения по умолчанию, не рекомендуется.

Пример: 1e-5

Типы данных: double

`MultiReadCorrection` - Флаг для улучшения оценки численности с использованием спасательного метода
`false` (по умолчанию) | `true`

Флаг для улучшения оценки плотности для считываний, сопоставленных с несколькими геномными позициями с использованием метода спасения, указанного как true или false. Если значение равно falseфункция делит множественные считывания равномерно на все отображенные позиции. Если значение равно trueфункция использует дополнительную информацию, включая оценку численности генов, предполагаемую длину фрагмента и смещение фрагмента, для улучшения оценки численности транскриптов.

Способ спасения описан в [3].

Пример: true

Типы данных: logical

`NormalizeCompatibleHits` - Флаг для использования только фрагментов, совместимых со ссылочным транскриптом, для вычисления значений FPKM
`true` (по умолчанию) | `false`

Флаг для использования только фрагментов, совместимых со ссылочным транскриптом, для вычисления значений FPKM, указанных как true или false.

Пример: false

Типы данных: logical

`NormalizeTotalHits` - Флаг для включения всех фрагментов для вычисления значений FPKM
`false` (по умолчанию) | `true`

Флаг для включения всех фрагментов для вычисления значений FPKM, указанных как true или false. Если значение равно trueфункция включает все фрагменты, включая фрагменты без совместимой ссылки.

Пример: true

Типы данных: logical

`NumFragAssignmentDraws` - Количество назначений фрагментов, выполняемых для каждого стенограммы
`50` (по умолчанию) | положительное целое число

Число назначений фрагментов, выполняемых для каждого транскрипта, указанное как положительное целое число. Для каждого фрагмента, взятого из транскрипта, функция выполняет заданное количество назначений вероятностно, чтобы определить неопределенность назначения транскрипта и оценить матрицу дисперсии-ковариации для назначенных счетчиков фрагментов.

Пример: 40

Типы данных: double

`NumFragDraws` - Число розыгрышей из генератора отрицательных биномиальных случайных чисел
`100` (по умолчанию) | положительное целое число

Число вытягиваний из отрицательного биномиального генератора случайных чисел для каждого транскрипта, заданного как положительное целое число. Каждый розыгрыш представляет собой ряд фрагментов, которые функция вероятностно присваивает транскриптам в транскриптоме для определения неопределенности назначения и оценки матрицы дисперсии-ковариации для назначенных счетчиков фрагментов.

Пример: 90

Типы данных: double

`NumThreads` - Количество параллельных потоков для использования
`1` (по умолчанию) | положительное целое число

Число параллельных потоков для использования, указанное как положительное целое число. Потоки выполняются на отдельных процессорах или ядрах. Увеличение количества потоков, как правило, значительно улучшает время выполнения, но увеличивает объем памяти.

Пример: 4

Типы данных: double

`OutputDirectory` - Каталог для хранения результатов анализа
текущий каталог (`"./"`) (по умолчанию) | строка | символьный вектор

Каталог для хранения результатов анализа, указанный как строковый или символьный вектор.

Пример: "./AnalysisResults/"

Типы данных: char | string

`Seed` - Начальное число для генератора случайных чисел
`0` (по умолчанию) | неотрицательное целое число

Начальное число для генератора случайных чисел, указанное как неотрицательное целое число. Установка начального значения обеспечивает воспроизводимость результатов анализа.

Пример: 10

Типы данных: double

`TimeSeries` - Флаг для обработки входных выборок как временных рядов
`false` (по умолчанию) | `true`

Флаг для обработки входных образцов как временных рядов, а не как независимых экспериментальных условий, указанных как true или false. Если задано значение true, вы должны предоставить образцы в порядке увеличения времени: первый SAM файл должен быть для первого момента времени, второй SAM файл для второго момента времени и так далее.

Пример: true

Типы данных: logical

`Version` - Поддерживаемая версия
последовательность

Это свойство доступно только для чтения.

Поддерживаемая версия программного обеспечения оригинальных запонок, возвращаемая в виде строки.

Пример: "2.2.1"

Типы данных: string

Функции объекта

`getCommand`	Преобразовать свойства объекта в исходный синтаксис параметров
`getOptionsTable`	Возвращать таблицу со всеми свойствами и эквивалентными параметрами в исходном синтаксисе

Примеры

свернуть все

Создание объекта CuffDiffOptions

Создать CuffDiffOptions со значениями по умолчанию.

opt = CuffDiffOptions;

Создайте объект, используя пары имя-значение.

opt2 = CuffDiffOptions('FalseDiscoveryRate',0.01,'NumThreads',4)

Создайте объект с помощью исходного синтаксиса.

opt3 = CuffDiffOptions('--FDR 0.01 --num-threads 4')

Сборка транскриптома и выполнение дифференциального тестирования экспрессии

Создать CufflinksOptions объект для определения параметров cfflinks, таких как количество параллельных потоков и папка вывода для хранения результатов.

cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";

Файлы SAM, представленные в этом примере, содержат выровненные чтения для Mycoplasma pneumoniae из двух образцов с тремя репликациями каждый. Считывание моделируется 100 bp для двух генов (gyrA и gyrB) расположены рядом друг с другом на геноме. Все операции чтения сортируются по ссылочному положению, как требуется cufflinks.

sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",...
        "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];

Соберите транскриптом из выровненных считываний.

[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);

gtfs - список GTF-файлов, содержащих собранные изоформы.

Сравнение собранных изоформ с помощью cuffcompare.

stats = cuffcompare(gtfs);

Объединить собранные стенограммы с помощью cuffmerge.

mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');

mergedGTF сообщает только одну стенограмму. Это потому, что два интересующих гена расположены рядом друг с другом, и cuffmerge не может различить два различных гена. Вести cuffmerge, использовать эталонный GTF (gyrAB.gtf), содержащий информацию об этих двух генах. Если файл находится не в том же каталоге, в котором выполняется cuffmerge из, необходимо также указать путь к файлу.

gyrAB = which('gyrAB.gtf');
mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',...
			'ReferenceGTF',gyrAB);

Рассчитайте плотность (уровни выражений) на основе выровненных чтений для каждого образца.

abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                        'OutputDirectory','./cuffquantOutput1');
abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],...
                        'OutputDirectory','./cuffquantOutput2');

Оцените значимость изменений в экспрессии генов и транскриптов между состояниями, выполнив дифференциальное тестирование с использованием cuffdiff. cuffdiff функция работает в два отдельных шага: функция сначала оценивает изобилие из выровненных считываний, а затем выполняет статистический анализ. В некоторых случаях (например, распределение вычислительной нагрузки между несколькими работниками) выполнение этих двух шагов по отдельности является желательным. После выполнения первого шага с cuffquant, затем можно использовать двоичный выходной файл CXB в качестве входных данных для cuffdiff для выполнения статистического анализа. Поскольку cuffdiff возвращает несколько файлов, укажите рекомендуемый выходной каталог.

isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],...
                      'OutputDirectory','./cuffdiffOutput');

Отображение таблицы, содержащей результаты теста дифференциальной экспрессии для двух генов gyrB и gyrA.

readtable(isoformDiff,'FileType','text')

ans =

  2×14 table

        test_id            gene_id        gene              locus             sample_1    sample_2    status     value_1       value_2      log2_fold_change_    test_stat    p_value    q_value    significant
    ________________    _____________    ______    _______________________    ________    ________    ______    __________    __________    _________________    _________    _______    _______    ___________

    'TCONS_00000001'    'XLOC_000001'    'gyrB'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     1.0913e+05    4.2228e+05          1.9522           7.8886      5e-05      5e-05        'yes'   
    'TCONS_00000002'    'XLOC_000001'    'gyrA'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     3.5158e+05    1.1546e+05         -1.6064          -7.3811      5e-05      5e-05        'yes'

Вы можете использовать cuffnorm для создания нормализованных таблиц выражений для дальнейшего анализа. cuffnorm результаты полезны, когда у вас есть много образцов, и вы хотите сгруппировать их или построить график уровней экспрессии для генов, которые важны в вашем исследовании. Обратите внимание, что невозможно выполнить дифференциальный анализ выражений с помощью cuffnorm.

Укажите массив ячеек, где каждый элемент является строковым вектором, содержащим имена файлов для одного образца с репликациями.

alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                  ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]}
isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,...
                      'OutputDirectory', './cuffnormOutput');

Отображение таблицы, содержащей нормализованные уровни выражений для каждого транскрипта.

readtable(isoformNorm,'FileType','text')

ans =

  2×7 table

      tracking_id          q1_0          q1_2          q1_1          q2_1          q2_0          q2_2   
    ________________    __________    __________    __________    __________    __________    __________

    'TCONS_00000001'    1.0913e+05         78628    1.2132e+05    4.3639e+05    4.2228e+05    4.2814e+05
    'TCONS_00000002'    3.5158e+05    3.7458e+05    3.4238e+05    1.0483e+05    1.1546e+05    1.1105e+05

Имена столбцов, начинающиеся с q, имеют формат conditionX_N, указывающий, что столбец содержит значения для репликации N условия X.

Ссылки

[1] Трапнелл, Коул, Брайан А Уильямс, Гео Пертеа, Али Мортазави, Гордон Кван, Марике Дж. ван Барен, Стивен Л Зальцберг, Барбара Дж. Уолд и Лиор Пэхтер. «Сборка и количественная оценка транскриптов с помощью РНК-Seq выявляет необъявленные транскрипты и переключение изоформ во время дифференцировки клеток». Биотехнология природы 28, № 5 (май 2010 года): 511-15.

[2] Андерс, Саймон и Вольфганг Хубер. «Анализ дифференциальных выражений для данных подсчета последовательностей». Биология генома 11, № 10 (октябрь 2010): R106. https://doi.org/10.1186/gb-2010-11-10-r106.

[3] Мортазави, Али, Брайан А Уильямс, Кеннет Маккью, Лориан Шеффер и Барбара Уолд. «Картирование и количественное определение транскриптомов млекопитающих с помощью РНК-Seq». Методы природопользования 5, № 7 (июль 2008 года): 621-28. https://doi.org/10.1038/nmeth.1226.

См. также

Темы

Пакеты поддержки ПО инструментария для биоинформатики

Внешние веб-сайты

Манжеты вручную

Представлен в R2019a

Документация

CuffDiffOptions

Описание

Создание

Синтаксис

Описание

Входные аргументы

S — cuffdiff варианты строка | символьный вектор

Свойства

ConditionLabels - Образцы этикеток строка | строковый вектор | символьный вектор | массив ячеек символьного вектора

ContrastFile - Имя контрастного файла строка | символьный вектор

DispersionMethod - Метод моделирования дисперсии в количестве фрагментов "pooled" (по умолчанию) | "per-condition" | "blind" | "poisson"

DoIsoformSwitch - Флаг для выполнения тестов на переключение изоформ true (по умолчанию) | false

EffectiveLengthCorrection - Флаг для нормализации количества фрагментов true (по умолчанию) | false

ExtraCommand - Дополнительные команды "" (по умолчанию) | строка | символьный вектор

FalseDiscoveryRate - Частота ложных обнаружений 0.05 (по умолчанию) | скаляр между 0 и 1

FragmentBiasCorrection - Имя файла FASTA со ссылочными транскриптами для обнаружения смещения строка | символьный вектор

FragmentLengthMean - Ожидаемая средняя длина фрагмента в парах оснований 200 (по умолчанию) | положительное целое число

FragmentLengthSD - Ожидаемое стандартное отклонение для распределения длины фрагмента 80 (по умолчанию) | положительный скаляр

GenerateAnalysisDiff - Флажок для создания файлов дифференциального анализа true (по умолчанию) | false

IncludeAll - Флаг для использования всех свойств объекта false (по умолчанию) | true

IsoformShiftReplicates - Минимальное количество реплик для тестирования генов на дифференциальную регуляцию 3 (по умолчанию) | положительное целое число

LengthCorrection - Флаг для исправления по длине стенограммы true (по умолчанию) | false

LibraryNormalizationMethod - Метод нормализации размера библиотеки "geometric" (по умолчанию) | "classic-fpkm" | "quartile"

MaskFile - Имя файла GTF или GFF, содержащего транскрипты для игнорирования строка | символьный вектор

MaxBundleFrags - Максимальное количество фрагментов, включаемых для каждого локуса перед пропуском 500000 (по умолчанию) | положительное целое число

MaxFragAlignments - Максимальное количество выровненных чтений, включаемых для каждого фрагмента Inf (по умолчанию) | положительное целое число

MaxMLEIterations - Максимальное количество итераций для оценки максимального правдоподобия 5000 (по умолчанию) | положительное целое число

MinAlignmentCount - Минимальное количество трасс, необходимых в локусе для проверки значимости 10 (по умолчанию) | положительное целое число

MinIsoformFraction - Минимальное количество изоформы, включаемое в тесты дифференциальной экспрессии 1e-5 (по умолчанию) | скаляр между 0 и 1

MultiReadCorrection - Флаг для улучшения оценки численности с использованием спасательного метода false (по умолчанию) | true

NormalizeCompatibleHits - Флаг для использования только фрагментов, совместимых со ссылочным транскриптом, для вычисления значений FPKM true (по умолчанию) | false

NormalizeTotalHits - Флаг для включения всех фрагментов для вычисления значений FPKM false (по умолчанию) | true

NumFragAssignmentDraws - Количество назначений фрагментов, выполняемых для каждого стенограммы 50 (по умолчанию) | положительное целое число

NumFragDraws - Число розыгрышей из генератора отрицательных биномиальных случайных чисел 100 (по умолчанию) | положительное целое число

NumThreads - Количество параллельных потоков для использования 1 (по умолчанию) | положительное целое число

OutputDirectory - Каталог для хранения результатов анализа текущий каталог ("./") (по умолчанию) | строка | символьный вектор

Seed - Начальное число для генератора случайных чисел 0 (по умолчанию) | неотрицательное целое число

TimeSeries - Флаг для обработки входных выборок как временных рядов false (по умолчанию) | true

Version - Поддерживаемая версия последовательность

Функции объекта

Примеры

Создание объекта CuffDiffOptions

Сборка транскриптома и выполнение дифференциального тестирования экспрессии

Ссылки

См. также

Темы

Внешние веб-сайты

Документация по инструментарию биоинформатики

Поддержка

`S` — `cuffdiff` варианты
строка | символьный вектор

`ConditionLabels` - Образцы этикеток
строка | строковый вектор | символьный вектор | массив ячеек символьного вектора

`ContrastFile` - Имя контрастного файла
строка | символьный вектор

`DispersionMethod` - Метод моделирования дисперсии в количестве фрагментов
`"pooled"` (по умолчанию) | `"per-condition"` | `"blind"` | `"poisson"`

`DoIsoformSwitch` - Флаг для выполнения тестов на переключение изоформ
`true` (по умолчанию) | `false`

`EffectiveLengthCorrection` - Флаг для нормализации количества фрагментов
`true` (по умолчанию) | `false`

`ExtraCommand` - Дополнительные команды
`""` (по умолчанию) | строка | символьный вектор

`FalseDiscoveryRate` - Частота ложных обнаружений
`0.05` (по умолчанию) | скаляр между `0` и `1`

`FragmentBiasCorrection` - Имя файла FASTA со ссылочными транскриптами для обнаружения смещения
строка | символьный вектор

`FragmentLengthMean` - Ожидаемая средняя длина фрагмента в парах оснований
`200` (по умолчанию) | положительное целое число

`FragmentLengthSD` - Ожидаемое стандартное отклонение для распределения длины фрагмента
`80` (по умолчанию) | положительный скаляр

`GenerateAnalysisDiff` - Флажок для создания файлов дифференциального анализа
`true` (по умолчанию) | `false`

`IncludeAll` - Флаг для использования всех свойств объекта
`false` (по умолчанию) | `true`

`IsoformShiftReplicates` - Минимальное количество реплик для тестирования генов на дифференциальную регуляцию
`3` (по умолчанию) | положительное целое число

`LengthCorrection` - Флаг для исправления по длине стенограммы
`true` (по умолчанию) | `false`

`LibraryNormalizationMethod` - Метод нормализации размера библиотеки
`"geometric"` (по умолчанию) | `"classic-fpkm"` | `"quartile"`

`MaskFile` - Имя файла GTF или GFF, содержащего транскрипты для игнорирования
строка | символьный вектор

`MaxBundleFrags` - Максимальное количество фрагментов, включаемых для каждого локуса перед пропуском
`500000` (по умолчанию) | положительное целое число

`MaxFragAlignments` - Максимальное количество выровненных чтений, включаемых для каждого фрагмента
`Inf` (по умолчанию) | положительное целое число

`MaxMLEIterations` - Максимальное количество итераций для оценки максимального правдоподобия
`5000` (по умолчанию) | положительное целое число

`MinAlignmentCount` - Минимальное количество трасс, необходимых в локусе для проверки значимости
`10` (по умолчанию) | положительное целое число

`MinIsoformFraction` - Минимальное количество изоформы, включаемое в тесты дифференциальной экспрессии
`1e-5` (по умолчанию) | скаляр между `0` и `1`

`MultiReadCorrection` - Флаг для улучшения оценки численности с использованием спасательного метода
`false` (по умолчанию) | `true`

`NormalizeCompatibleHits` - Флаг для использования только фрагментов, совместимых со ссылочным транскриптом, для вычисления значений FPKM
`true` (по умолчанию) | `false`

`NormalizeTotalHits` - Флаг для включения всех фрагментов для вычисления значений FPKM
`false` (по умолчанию) | `true`

`NumFragAssignmentDraws` - Количество назначений фрагментов, выполняемых для каждого стенограммы
`50` (по умолчанию) | положительное целое число

`NumFragDraws` - Число розыгрышей из генератора отрицательных биномиальных случайных чисел
`100` (по умолчанию) | положительное целое число

`NumThreads` - Количество параллельных потоков для использования
`1` (по умолчанию) | положительное целое число

`OutputDirectory` - Каталог для хранения результатов анализа
текущий каталог (`"./"`) (по умолчанию) | строка | символьный вектор

`Seed` - Начальное число для генератора случайных чисел
`0` (по умолчанию) | неотрицательное целое число

`TimeSeries` - Флаг для обработки входных выборок как временных рядов
`false` (по умолчанию) | `true`

`Version` - Поддерживаемая версия
последовательность