запонки

Соберите транскриптом от выровненных чтений

свернуть все на странице

Синтаксис

cufflinks(alignmentFiles)

cufflinks(alignmentFiles,cufflinksOptions)

cufflinks(alignmentFiles,Name,Value)

[transcripts,isoforms,genes,skippedTranscripts] = cufflinks(___)

Описание

пример

cufflinks(alignmentFiles) собирает транскриптом от выровненных чтений в alignmentFile и определяет количество уровня выражения для каждой расшифровки стенограммы [1]. По умолчанию функция пишет результаты в файл с именем GTF transcripts.gtf в текущем каталоге.

cufflinks требует Пакета Поддержки Запонок для Bioinformatics Toolbox™. Если пакет поддержки не установлен, то функция обеспечивает ссылку на загрузку.

Примечание

cufflinks поддерживается на Mac и платформах UNIX^® только.

cufflinks(alignmentFiles,cufflinksOptions) дополнительные опции использования заданы cufflinksOptions.

cufflinks(alignmentFiles,Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары "имя-значение". Например, cufflinks(alignmentFile,'TrimCoverageThreshold',5) задает минимальное среднее покрытие для 3' обрезки конца.

[transcripts,isoforms,genes,skippedTranscripts] = cufflinks(___) возвращает имена файлов собранного транскриптома с помощью любой из комбинаций входных аргументов от предыдущих синтаксисов. По умолчанию функция сохранила все файлы к текущему каталогу.

Примеры

свернуть все

Соберите транскриптом и выполните дифференциальное тестирование выражения

Создайте объект CufflinksOptions задать опции запонок, такие как количество параллельных потоков и выходной директории, чтобы сохранить результаты.

cflOpt = CufflinksOptions;
cflOpt.NumThreads = 8;
cflOpt.OutputDirectory = "./cufflinksOut";

Файлы SAM предусмотрели этот пример, содержат выровненные чтения для Микоплазмы pneumoniae от двух выборок с три, реплицирует каждого. Чтения моделируются 100bp-чтения для двух генов (gyrA и gyrB) расположенный друг рядом с другом на геноме. Все чтения сортируются по ссылочному положению, как требуется по cufflinks.

sams = ["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam",...
        "Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"];

Соберите транскриптом от выровненных чтений.

[gtfs,isofpkm,genes,skipped] = cufflinks(sams,cflOpt);

gtfs является списком файлов GTF, которые содержат собранные изоформы.

Сравните собранные изоформы с помощью cuffcompare.

stats = cuffcompare(gtfs);

Объедините собранные расшифровки стенограммы с помощью cuffmerge.

mergedGTF = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput');

mergedGTF сообщает о только одной расшифровке стенограммы. Это вызвано тем, что два гена интереса расположены друг рядом с другом, и cuffmerge не может отличить два отличных гена. Чтобы вести cuffmerge, используйте ссылочный GTF (gyrAB.gtf), содержащий информацию об этих двух генах. Если файл не расположен в той же директории, от которой вы запускаете cuffmerge, необходимо также задать путь к файлу.

gyrAB = which('gyrAB.gtf');
mergedGTF2 = cuffmerge(gtfs,'OutputDirectory','./cuffMergeOutput2',...
			'ReferenceGTF',gyrAB);

Вычислите распространенности (уровни экспрессии) от выровненных чтений для каждой выборки.

abundances1 = cuffquant(mergedGTF2,["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                        'OutputDirectory','./cuffquantOutput1');
abundances2 = cuffquant(mergedGTF2,["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"],...
                        'OutputDirectory','./cuffquantOutput2');

Оцените значение изменений в выражении для генов и расшифровок стенограммы между условиями путем выполнения тестирования дифференциала с помощью cuffdiff. Функция cuffdiff действует на двух отличных шагах: функция сначала оценивает распространенности от выровненных чтений, и затем выполняет статистический анализ. В некоторых случаях (например, распределяя вычисляющий загрузку через несколько рабочих), выполнение двух шагов отдельно желательно. После выполнения первого шага с cuffquant можно затем использовать бинарный выходной файл CXB в качестве входа к cuffdiff, чтобы выполнить статистический анализ. Поскольку cuffdiff возвращает несколько файлов, укажите, что выходная директория рекомендуется.

isoformDiff = cuffdiff(mergedGTF2,[abundances1,abundances2],...
                      'OutputDirectory','./cuffdiffOutput');

Отобразите таблицу, содержащую дифференциальные результаты испытаний выражения для этих двух генов gyrB и gyrA.

readtable(isoformDiff,'FileType','text')

ans =

  2×14 table

        test_id            gene_id        gene              locus             sample_1    sample_2    status     value_1       value_2      log2_fold_change_    test_stat    p_value    q_value    significant
    ________________    _____________    ______    _______________________    ________    ________    ______    __________    __________    _________________    _________    _______    _______    ___________

    'TCONS_00000001'    'XLOC_000001'    'gyrB'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     1.0913e+05    4.2228e+05          1.9522           7.8886      5e-05      5e-05        'yes'   
    'TCONS_00000002'    'XLOC_000001'    'gyrA'    'NC_000912.1:2868-7340'      'q1'        'q2'       'OK'     3.5158e+05    1.1546e+05         -1.6064          -7.3811      5e-05      5e-05        'yes'

Можно использовать cuffnorm, чтобы сгенерировать нормированные таблицы выражения для последующих анализов. результаты cuffnorm полезны, когда у вас есть много выборок, и вы хотите кластеризировать их или уровни экспрессии графика для генов, которые важны в вашем исследовании. Обратите внимание на то, что вы не можете выполнить дифференциальный анализ выражения с помощью cuffnorm.

Задайте массив ячеек, где каждый элемент является вектором строки, содержащим имена файлов для одной выборки с, реплицирует.

alignmentFiles = {["Myco_1_1.sam","Myco_1_2.sam","Myco_1_3.sam"],...
                  ["Myco_2_1.sam", "Myco_2_2.sam", "Myco_2_3.sam"]}
isoformNorm = cuffnorm(mergedGTF2, alignmentFiles,...
                      'OutputDirectory', './cuffnormOutput');

Отобразите таблицу, содержащую нормированные уровни экспрессии для каждой расшифровки стенограммы.

readtable(isoformNorm,'FileType','text')

ans =

  2×7 table

      tracking_id          q1_0          q1_2          q1_1          q2_1          q2_0          q2_2   
    ________________    __________    __________    __________    __________    __________    __________

    'TCONS_00000001'    1.0913e+05         78628    1.2132e+05    4.3639e+05    4.2228e+05    4.2814e+05
    'TCONS_00000002'    3.5158e+05    3.7458e+05    3.4238e+05    1.0483e+05    1.1546e+05    1.1105e+05

Имена столбцов начиная с q имеют формат: conditionX_N, указывая, что столбец содержит значения для, реплицируют N conditionX.

Входные параметры

свернуть все

`alignmentFiles` — Имена SAM или файлов BAM
представьте в виде строки | вектор строки | вектор символов | массив ячеек из символьных векторов

Имена SAM или файлов BAM, заданных как строка, представляют в виде строки вектор, вектор символов или массив ячеек из символьных векторов. Входные файлы должны быть отсортированы по ссылочному положению.

Пример: 'Myco_1_1.sam'

Типы данных: char | string

`cufflinksOptions` — Опции запонок
Объект `CufflinksOptions` | вектор символов | строка

Опции запонок, заданные как объект CufflinksOptions, вектор символов или строка. Вектор символов или строка должны быть в синтаксисе опции запонок (снабжены префиксом одним или двумя тире) [1].

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: cufflinks(alignmentFile,'TrimCoverageThreshold',5,'FragmentLengthMean',180)

`'EffectiveLengthCorrection'` — Отметьте, чтобы нормировать количества фрагмента
`true` (значение по умолчанию) | `false`

Отметьте, чтобы нормировать количества фрагмента к фрагментам на kilobase на миллион сопоставленных чтений (FPKM), заданный как true или false.

Пример: 'EffectiveLengthCorrection',false

Типы данных: логический

`'ExtraCommand'` — Дополнительные команды
`""` (значение по умолчанию) | представляет в виде строки | вектор символов

Дополнительные команды, заданные как строка или вектор символов. Команды должны быть в исходном синтаксисе (снабжены префиксом одним или двумя тире). Используйте эту опцию, чтобы применить недокументированные флаги и флаги без соответствующих свойств MATLAB. Когда функция преобразовывает исходные флаги в свойства MATLAB, она хранит любые нераспознанные флаги в этой опции.

Пример: 'ExtraCommand','--library-type fr-secondstrand'

Типы данных: char | string

`'FauxReadTiling'` — Отметьте, чтобы включать ссылочные расшифровки стенограммы в собранный вывод
`true` (значение по умолчанию) | `false`

Отметьте, чтобы включать ссылочные расшифровки стенограммы в собранный вывод как поддельные чтения во время RABT (усовершенствованная ссылочная основанная на аннотации расшифровка стенограммы) блок, заданный как true или false.

Примечание

Функция только выполняет блок RABT, если вы задаете GTFGuide. В противном случае FauxReadTiling, независимо от того, чтобы быть true или false, не имеет никакого эффекта на собранную расшифровку стенограммы.

Пример: 'FauxReadTiling',false

Типы данных: логический

`'FragmentBiasCorrection'` — Имя файла FASTA со ссылочными расшифровками стенограммы, чтобы обнаружить смещение
представьте в виде строки | вектор символов

Имя файла FASTA со ссылочными расшифровками стенограммы, чтобы обнаружить смещение в количествах фрагмента, заданных как строка или вектор символов. Подготовка библиотеки может ввести специфичное для последовательности смещение в эксперименты RNA-Seq. Обеспечение ссылочных расшифровок стенограммы улучшает точность оценок распространенности расшифровки стенограммы.

Пример: 'FragmentBiasCorrection','ref.fasta'

Типы данных: char | string

`'FragmentLengthMean'` — Ожидаемая средняя длина фрагмента
`200` (значение по умолчанию) | положительное целое число

Ожидаемая средняя длина фрагмента, заданная как положительное целое число. Значение по умолчанию является парами оснований 200. Функция может изучить среднее значение длины фрагмента для каждого файла SAM. Используя эту опцию не рекомендуется для чтений парного конца.

Пример: 'FragmentLengthMean',100

Типы данных: double

`'FragmentLengthSD'` — Ожидаемое стандартное отклонение для распределения длины фрагмента
`80` (значение по умолчанию) | положительная скалярная величина

Ожидаемое стандартное отклонение для распределения длины фрагмента, заданного как положительная скалярная величина. Значение по умолчанию является парами оснований 80. Функция может изучить стандартное отклонение длины фрагмента для каждого файла SAM. Используя эту опцию не рекомендуется для чтений парного конца.

Пример: 'FragmentLengthSTD',70

Типы данных: double

`'GTFGuide'` — Имя файла GTF, чтобы вести блок RABT
представьте в виде строки | вектор символов

Имя файла GTF, чтобы вести блок RABT, заданный как строка или вектор символов.

Пример: 'GTFGuide','tr.gtf'

Типы данных: char | string

`'IncludeAll'` — Отметьте, чтобы применить все доступные параметры
`false` (значение по умолчанию) | верный

Отметьте, чтобы включать все доступные параметры с соответствующими значениями по умолчанию при преобразовании в исходный синтаксис опций, заданный как true или false. Исходный синтаксис снабжается префиксом одним или двумя тире, такими как '-d 100 -e 80'. По умолчанию функция преобразовывает только заданные опции. Если значением является true, функция преобразовывает все доступные параметры, со значениями по умолчанию для незаданных опций, к исходному синтаксису.

Пример: 'IncludeAll',true

Типы данных: логический

`'RABTOverhangTolerance'` — Количество пар оснований позволило накладываться с интроном расшифровки стенограммы
`8` (значение по умолчанию) | положительное целое число

Количество пар оснований от чтения позволило накладываться с интроном расшифровки стенограммы при определении, является ли чтение отображаемым к другой расшифровке стенограммы во время блока RABT, заданного как положительное целое число. Значением по умолчанию является 8.

Примечание

Функция только выполняет блок RABT, если вы задаете GTFGuide. В противном случае RABTOverhangTolerance не имеет никакого эффекта на собранную расшифровку стенограммы.

Пример: 'IntronOverhangTolerance',10

Типы данных: double

`'JunctionAlpha'` — Альфа-значение в биномиальном тесте, чтобы отфильтровать ложно-положительные выравнивания
`0.001` (значение по умолчанию) | скаляр между `0` и `1`

Альфа-значение в биномиальном тесте, чтобы отфильтровать ложно-положительные выравнивания, заданные как скаляр между 0 и 1.

Пример: 'JunctionAlpha',0.005

Типы данных: double

`'LengthCorrection'` — Отметьте, чтобы исправить длиной расшифровки стенограммы
`true` (значение по умолчанию) | `false`

Отметьте, чтобы исправить длиной расшифровки стенограммы, заданной как true или false. Установите это значение к false только, когда количество фрагмента независимо от размера элемента, такой что касается небольших библиотек RNA без фрагментации и для 3' упорядочиваний конца, где все фрагменты имеют ту же длину.

Пример: 'LengthCorrection',false

Типы данных: логический

`'MaskFile'` — Имя GTF или файла GFF, содержащего расшифровки стенограммы, чтобы проигнорировать
представьте в виде строки | вектор символов

Имя GTF или файла GFF, содержащего расшифровки стенограммы, чтобы проигнорировать во время анализа, заданного как строка или вектор символов. Некоторые примеры расшифровок стенограммы, чтобы проигнорировать включают аннотируемые rRNA расшифровки стенограммы, митохондриальные расшифровки стенограммы и другие богатые расшифровки стенограммы. Игнорирование этих расшифровок стенограммы улучшает робастность оценок распространенности.

Пример: 'MaskFile','excludes.gtf'

Типы данных: char | string

`'MaxBundleFrags'` — Максимальное количество фрагментов, чтобы включать для каждого местоположения перед пропуском
`500000` (значение по умолчанию) | положительное целое число

Максимальное количество фрагментов, чтобы включать для каждого местоположения прежде, чем пропустить новые фрагменты, заданные как положительное целое число. Пропущенные фрагменты отмечены состоянием HIDATA в файле skipped.gtf.

Пример: 'MaxBundleFrags',400000

Типы данных: double

`'MaxBundleLength'` — Максимальная геномная длина в парах оснований для пакета
`3500000` (значение по умолчанию) | положительное целое число

Максимальная геномная длина в парах оснований для пакета, заданного как положительное целое число.

Пример: 'MaxBundleLength',3400000

Типы данных: double

`'MaxFragAlignments'` — Максимальное количество выровненных чтений, чтобы включать для каждого фрагмента
`Inf` (значение по умолчанию) | положительное целое число

Максимальное количество выровненных чтений, чтобы включать для каждого фрагмента прежде, чем пропустить новые чтения, заданные как положительное целое число. Inf, значение по умолчанию, не устанавливает предела для максимального количества выровненных чтений.

Пример: 'MaxFragAlignments',1000

Типы данных: double

`'MaxIntronLength'` — Максимальное количество основ в интроне
`300000` (значение по умолчанию) | положительное целое число

Максимальное количество основ в интроне, чтобы сообщить, заданный как положительное целое число. cufflinks также игнорирует выравнивания SAM с операциями REF_SKIP CIGAR дольше, чем это значение свойства.

Пример: 'MaxIntronLength',350000

Типы данных: double

`'MaxMLEIterations'` — Максимальное количество итераций для оценки наибольшего правдоподобия
`5000` (значение по умолчанию) | положительное целое число

Максимальное количество итераций для оценки наибольшего правдоподобия распространенностей, заданных как положительное целое число.

Пример: 'MaxMLEIterations',4000

Типы данных: double

`'MinFragsPerTransfrag'` — Минимальное количество выровненных фрагментов RNA-Seq, чтобы сообщить
`10` (значение по умолчанию) | положительное целое число

Минимальное количество выровненных фрагментов RNA-Seq, чтобы сообщить относительно собранного transfrag, заданного как положительное целое число.

Пример: 'MinFragsPerTransfrag',15

Типы данных: double

`'MinIntronLength'` — Минимальное количество пар оснований для интрона в геноме
`50` (значение по умолчанию) | положительное целое число

Минимальное количество пар оснований для интрона в геноме, заданном как положительное целое число.

Пример: 'MinIntronLength',50

Типы данных: double

`'MinIsoformFraction'` — Значение Каффофф, чтобы сообщить о распространенности изоформы
`0.1` (значение по умолчанию) | скаляр между `0` и `1`

Значение Каффофф, чтобы сообщить о распространенности конкретной изоформы как часть самой богатой изоформы (главная изоформа), заданный как скаляр между 0 и 1. Функция отфильтровывает расшифровки стенограммы с распространенностями ниже заданного значения, потому что изоформы, выраженные по поводу низких уровней часто, не могут собираться надежно. Значение по умолчанию 0.1, или 10%, главной изоформы гена.

Пример: 'MinIsoformFraction',0.20

Типы данных: double

`'MultiReadCorrection'` — Отметьте, чтобы улучшить оценку распространенности с помощью спасательного метода
`false` (значение по умолчанию) | `true`

Отметьте, чтобы улучшить оценку распространенности для чтений, сопоставленных с несколькими геномными положениями с помощью спасательного метода, заданного как true или false. Если значением является false, функция делит мультисопоставленные чтения однородно ко всем сопоставленным позициям. Если значением является true, функция использует дополнительную информацию, включая генную оценку распространенности, выведенную длину фрагмента, и смещение фрагмента, чтобы улучшить оценку распространенности расшифровки стенограммы.

Спасательный метод описан в [2].

Пример: true

Типы данных: логический

`'NormalizeCompatibleHits'` — Отметьте, чтобы использовать только фрагменты, совместимые со ссылочной расшифровкой стенограммы, чтобы вычислить значения FPKM
`false` (значение по умолчанию) | `true`

Отметьте, чтобы использовать только фрагменты, совместимые со ссылочной расшифровкой стенограммы, чтобы вычислить значения FPKM, заданные как true или false.

Пример: 'NormalizeCompatibleHits',false

Типы данных: логический

`'NormalizeTotalHits'` — Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKM
`false` (значение по умолчанию) | `true`

Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKM, заданные как true или false. Если значением является true, функция включает все фрагменты, включая фрагменты без совместимой ссылки.

Пример: 'NormalizeTotalHits',true

Типы данных: логический

`'NumFragAssignmentDraws'` — Количество присвоений фрагмента, чтобы выполнить на каждой расшифровке стенограммы
`50` (значение по умолчанию) | положительное целое число

Количество присвоений фрагмента, чтобы выполнить на каждой расшифровке стенограммы, заданной как положительное целое число. Для каждого фрагмента, чертившего из расшифровки стенограммы, функция выполняет конкретное количество присвоений вероятностно, чтобы определить неуверенность присвоения расшифровки стенограммы и оценить ковариационную матрицу отклонения для присвоенных количеств фрагмента.

Пример: 'NumFragAssignmentSamples',40

Типы данных: double

`'NumFragDraws'` — Количество ничьих от отрицательного биномиального генератора случайных чисел
`100` (значение по умолчанию) | положительное целое число

Количество ничьих от отрицательного биномиального генератора случайных чисел для каждой расшифровки стенограммы, заданной как положительное целое число. Каждый ничья является многими фрагментами, которые функция вероятностно присваивает расшифровкам стенограммы в транскриптоме, чтобы определить неуверенность присвоения и оценить ковариационную матрицу отклонения для присвоенных количеств фрагмента.

Пример: 'NumFragSamples',90

Типы данных: double

`'NumThreads'` — Количество параллельных потоков, чтобы использовать
`1` (значение по умолчанию) | положительное целое число

Количество параллельных потоков, чтобы использовать, заданный как положительное целое число. Потоки запущены на отдельных процессорах или ядрах. Увеличение числа потоков обычно значительно улучшает время выполнения, но увеличивает объем потребляемой памяти.

Пример: 'NumThreads',4

Типы данных: double

`'OutputDirectory'` — Директория, чтобы сохранить результаты анализа
текущий каталог (`"./"`) (значение по умолчанию) | представляет в виде строки | вектор символов

Директория, чтобы сохранить результаты анализа, заданные как строка или вектор символов.

Пример: 'OutputDirectory',"./AnalysisResults/"

Типы данных: char | string

`'OverhangTolerance'` — Количество пар оснований перекрытия с интроном
`8` (значение по умолчанию) | положительное целое число

Количество пар оснований перекрытия с интроном, который функция позволяет при определении, совместимо ли чтение с другой расшифровкой стенограммы, заданной как положительное целое число.

Пример: 'OverhangTolerance',5

Типы данных: double

`'RABTOverhangTolerance3'` — Количество пар оснований позволило нависать над 3' концами ссылочной расшифровки стенограммы
`600` (значение по умолчанию) | положительное целое число

Количество пар оснований позволило нависать над 3' концами каждой ссылочной расшифровки стенограммы во время блока RABT, заданного как положительное целое число. Функция использует это свойство при решении, нова ли собранная расшифровка стенограммы или должна быть объединена со ссылкой.

Примечание

Функция только выполняет блок RABT, если вы задаете GTFGuide. В противном случае RABTOverhangTolerance3 не имеет никакого эффекта на собранную расшифровку стенограммы.

Пример: 'OverhangTolerance3',500

Типы данных: double

`'OverlapRadius'` — Расстояние между transfrags
`50` (значение по умолчанию) | положительное целое число

Расстояние между transfrags, заданным как положительное целое число. Если расстояние ниже заданного значения, функция объединяет transfrags. Значение по умолчанию является парами оснований 50.

Пример: 'OverlapRadius',40

Типы данных: double

`'PreMRNAFraction'` — Порог, чтобы включать выравнивания в интронные интервалы
`0.15` (значение по умолчанию) | скаляр между `0` и `1`

Порог, чтобы включать выравнивания в интронные интервалы в блоке, заданном как скаляр между 0 и 1. Функция игнорирует интронные выравнивания, если минимальная глубина покрытия, разделенного на количество соединенных чтений, ниже заданного значения. Используйте это свойство отфильтровать чтения, происходящие из не полностью соединенных расшифровок стенограммы.

Пример: 'PreMRNAFraction',0.10

Типы данных: double

`'ReferenceGTF'` — Имя GTF или файла GFF, содержащего ссылочную аннотацию
представьте в виде строки | вектор символов

Имя GTF или файла GFF, содержащего ссылочную аннотацию раньше, оценивало выражение изоформы, заданное как строка или вектор символов. Если вы обеспечиваете файл ReferenceGTF, функция не собирает новых расшифровок стенограммы и игнорирует любые выравнивания, несовместимые со ссылочными расшифровками стенограммы.

Пример: 'ReferenceGTF',"isoest.gtf"

Типы данных: char | string

`'Seed'` — Отберите для генератора случайных чисел
`0` (значение по умолчанию) | неотрицательное целое число

Отберите для генератора случайных чисел, заданного как неотрицательное целое число. Устанавливание значения seed гарантирует воспроизводимость результатов анализа.

Пример: 'Seed',10

Типы данных: double

`'SmallAnchorFraction'` — Минимальный процент выравнивания на каждой стороне соединения соединения встык
`0.09` (значение по умолчанию) | скаляр между `0` и `1`

Минимальный процент выравнивания на каждой стороне соединения соединения встык, заданного как скаляр между 0 и 1. Функция фильтрует выравнивания с процентом, меньшим, чем это значение свойства до блока.

Пример: 'SmallAnchorFraction',0.1

Типы данных: double

`'TranscriptPrefix'` — Префикс для transfrags, о котором сообщают, в файле вывода GTF
`"CUFF"` (значение по умолчанию) | представляет в виде строки | вектор символов

Префикс для transfrags, о котором сообщают, в файле вывода GTF, заданном как строка или вектор символов. Эта опция должна быть строкой или вектором символов с ненулевой длиной.

Пример: 'TranscriptPrefix',"tfrags"

Типы данных: char | string

`'TrimCoverageThreshold'` — Минимальное среднее покрытие необходимо для 3' обрезки
`10` (значение по умолчанию) | положительное целое число

Минимальное среднее покрытие для 3' обрезки, заданной как положительное целое число.

Пример: 'TrimCoverageThreshold',8

Типы данных: double

`'TrimDropoffFraction'` — Минимальный процент среднего покрытия
`0.1` (значение по умолчанию) | скаляр между `0` и `1`

Минимальный процент среднего покрытия для обрезки 3' концов собранных расшифровок стенограммы, заданных как скаляр между 0 и 1.

Пример: 'TrimDropoffFraction',0.15

Типы данных: double

Выходные аргументы

свернуть все

`transcripts` — Имя файла расшифровки стенограммы
`"./transcripts.gtf"` (значение по умолчанию)

Имя файла расшифровки стенограммы, возвращенное как строка. Именем файла является "transcripts.gtf". Файл содержит собранные изоформы, наряду с атрибутами, описывающими распространенность чтений, происходящих из каждой расшифровки стенограммы.

Выводимая строка также включает информацию о директории, заданную OutputDirectory. Значением по умолчанию является текущий каталог. Если вы устанавливаете OutputDirectory на "/local/tmp/", вывод становится "/local/tmp/transcripts.gtf".

`isoforms` — Предполагаемое имя файла выражения уровня изоформы
`"./isoforms.fpkm_tracking.gtf"` (значение по умолчанию)

Предполагаемое имя файла выражения уровня изоформы, возвращенное как строка. По умолчанию именем файла является "isoforms.fpkm_tracking.gtf". Файл содержит оценки для выражения уровня изоформы в cufflinks FPKM отслеживание формата.

`genes` — Предполагаемое имя файла выражения генного уровня
`"./genes.fpkm_tracking.gtf"` (значение по умолчанию)

Предполагаемое имя файла выражения генного уровня, возвращенное как строка. По умолчанию именем файла является "genes.fpkm_tracking.gtf". Файл содержит оценки для выражения генного уровня в cufflinks FPKM отслеживание формата.

`skippedTranscripts` — Имя файла, содержащего пропущенные расшифровки стенограммы
`"./skipped.gtf"` (значение по умолчанию)

Имя файла, содержащего пропущенные расшифровки стенограммы при обработке местоположения, возвращенного как строка. По умолчанию именем файла является "skipped.gtf". Опция 'MaxBundleFrags' задает максимальное количество расшифровок стенограммы (фрагменты), чтобы включать для каждого местоположения. После достижения порога функция помещает пропущенные фрагменты в этот файл.

Ссылки

[1] Trapnell, C., Б. Уильямс, Г. Пертеа, А. Мортэзэви, Г. Кван, Дж. ван Бэрен, С. Залцберг, B. Пустошь и Л. Пэчтер. 2010. Блок расшифровки стенограммы и квантификация RNA-Seq показывают неаннотируемые расшифровки стенограммы и изоформу, переключающуюся во время клеточной дифференцировки. Биотехнология природы. 28:511–515.

[2] Mortazavi, A., Б. Уильямс, К. Макку, Л. Шэеффер и Б. Уолд. 2008. Отображение и определение количества транскриптомов млекопитающих RNA-Seq. Методы природы. 5:621-628.

Документация

запонки

Синтаксис

Описание

Примечание

Примеры

Соберите транскриптом и выполните дифференциальное тестирование выражения

Входные параметры

alignmentFiles — Имена SAM или файлов BAM представьте в виде строки | вектор строки | вектор символов | массив ячеек из символьных векторов

cufflinksOptions — Опции запонок Объект CufflinksOptions | вектор символов | строка

Аргументы в виде пар имя-значение

'EffectiveLengthCorrection' — Отметьте, чтобы нормировать количества фрагмента true (значение по умолчанию) | false

'ExtraCommand' — Дополнительные команды "" (значение по умолчанию) | представляет в виде строки | вектор символов

'FauxReadTiling' — Отметьте, чтобы включать ссылочные расшифровки стенограммы в собранный вывод true (значение по умолчанию) | false

Примечание

'FragmentBiasCorrection' — Имя файла FASTA со ссылочными расшифровками стенограммы, чтобы обнаружить смещение представьте в виде строки | вектор символов

'FragmentLengthMean' — Ожидаемая средняя длина фрагмента 200 (значение по умолчанию) | положительное целое число

'FragmentLengthSD' — Ожидаемое стандартное отклонение для распределения длины фрагмента 80 (значение по умолчанию) | положительная скалярная величина

'GTFGuide' — Имя файла GTF, чтобы вести блок RABT представьте в виде строки | вектор символов

'IncludeAll' — Отметьте, чтобы применить все доступные параметры false (значение по умолчанию) | верный

'RABTOverhangTolerance' — Количество пар оснований позволило накладываться с интроном расшифровки стенограммы 8 (значение по умолчанию) | положительное целое число

Примечание

'JunctionAlpha' — Альфа-значение в биномиальном тесте, чтобы отфильтровать ложно-положительные выравнивания 0.001 (значение по умолчанию) | скаляр между 0 и 1

'LengthCorrection' — Отметьте, чтобы исправить длиной расшифровки стенограммы true (значение по умолчанию) | false

'MaskFile' — Имя GTF или файла GFF, содержащего расшифровки стенограммы, чтобы проигнорировать представьте в виде строки | вектор символов

'MaxBundleFrags' — Максимальное количество фрагментов, чтобы включать для каждого местоположения перед пропуском 500000 (значение по умолчанию) | положительное целое число

'MaxBundleLength' — Максимальная геномная длина в парах оснований для пакета 3500000 (значение по умолчанию) | положительное целое число

'MaxFragAlignments' — Максимальное количество выровненных чтений, чтобы включать для каждого фрагмента Inf (значение по умолчанию) | положительное целое число

'MaxIntronLength' — Максимальное количество основ в интроне 300000 (значение по умолчанию) | положительное целое число

'MaxMLEIterations' — Максимальное количество итераций для оценки наибольшего правдоподобия 5000 (значение по умолчанию) | положительное целое число

'MinFragsPerTransfrag' — Минимальное количество выровненных фрагментов RNA-Seq, чтобы сообщить 10 (значение по умолчанию) | положительное целое число

'MinIntronLength' — Минимальное количество пар оснований для интрона в геноме 50 (значение по умолчанию) | положительное целое число

'MinIsoformFraction' — Значение Каффофф, чтобы сообщить о распространенности изоформы 0.1 (значение по умолчанию) | скаляр между 0 и 1

'MultiReadCorrection' — Отметьте, чтобы улучшить оценку распространенности с помощью спасательного метода false (значение по умолчанию) | true

'NormalizeTotalHits' — Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKM false (значение по умолчанию) | true

'NumFragAssignmentDraws' — Количество присвоений фрагмента, чтобы выполнить на каждой расшифровке стенограммы 50 (значение по умолчанию) | положительное целое число

'NumFragDraws' — Количество ничьих от отрицательного биномиального генератора случайных чисел 100 (значение по умолчанию) | положительное целое число

'NumThreads' — Количество параллельных потоков, чтобы использовать 1 (значение по умолчанию) | положительное целое число

'OutputDirectory' — Директория, чтобы сохранить результаты анализа текущий каталог ("./") (значение по умолчанию) | представляет в виде строки | вектор символов

'OverhangTolerance' — Количество пар оснований перекрытия с интроном 8 (значение по умолчанию) | положительное целое число

'RABTOverhangTolerance3' — Количество пар оснований позволило нависать над 3' концами ссылочной расшифровки стенограммы 600 (значение по умолчанию) | положительное целое число

Примечание

'OverlapRadius' — Расстояние между transfrags 50 (значение по умолчанию) | положительное целое число

'PreMRNAFraction' — Порог, чтобы включать выравнивания в интронные интервалы 0.15 (значение по умолчанию) | скаляр между 0 и 1

'ReferenceGTF' — Имя GTF или файла GFF, содержащего ссылочную аннотацию представьте в виде строки | вектор символов

'Seed' — Отберите для генератора случайных чисел 0 (значение по умолчанию) | неотрицательное целое число

'SmallAnchorFraction' — Минимальный процент выравнивания на каждой стороне соединения соединения встык 0.09 (значение по умолчанию) | скаляр между 0 и 1

'TranscriptPrefix' — Префикс для transfrags, о котором сообщают, в файле вывода GTF "CUFF" (значение по умолчанию) | представляет в виде строки | вектор символов

'TrimCoverageThreshold' — Минимальное среднее покрытие необходимо для 3' обрезки 10 (значение по умолчанию) | положительное целое число

'TrimDropoffFraction' — Минимальный процент среднего покрытия 0.1 (значение по умолчанию) | скаляр между 0 и 1

Выходные аргументы

transcripts — Имя файла расшифровки стенограммы "./transcripts.gtf" (значение по умолчанию)

isoforms — Предполагаемое имя файла выражения уровня изоформы "./isoforms.fpkm_tracking.gtf" (значение по умолчанию)

genes — Предполагаемое имя файла выражения генного уровня "./genes.fpkm_tracking.gtf" (значение по умолчанию)

skippedTranscripts — Имя файла, содержащего пропущенные расшифровки стенограммы "./skipped.gtf" (значение по умолчанию)

Ссылки

Смотрите также

Внешние веб-сайты

Введенный в R2019a

Документация Bioinformatics Toolbox

Поддержка

`alignmentFiles` — Имена SAM или файлов BAM
представьте в виде строки | вектор строки | вектор символов | массив ячеек из символьных векторов

`cufflinksOptions` — Опции запонок
Объект `CufflinksOptions` | вектор символов | строка

`'EffectiveLengthCorrection'` — Отметьте, чтобы нормировать количества фрагмента
`true` (значение по умолчанию) | `false`

`'ExtraCommand'` — Дополнительные команды
`""` (значение по умолчанию) | представляет в виде строки | вектор символов

`'FauxReadTiling'` — Отметьте, чтобы включать ссылочные расшифровки стенограммы в собранный вывод
`true` (значение по умолчанию) | `false`

`'FragmentBiasCorrection'` — Имя файла FASTA со ссылочными расшифровками стенограммы, чтобы обнаружить смещение
представьте в виде строки | вектор символов

`'FragmentLengthMean'` — Ожидаемая средняя длина фрагмента
`200` (значение по умолчанию) | положительное целое число

`'FragmentLengthSD'` — Ожидаемое стандартное отклонение для распределения длины фрагмента
`80` (значение по умолчанию) | положительная скалярная величина

`'GTFGuide'` — Имя файла GTF, чтобы вести блок RABT
представьте в виде строки | вектор символов

`'IncludeAll'` — Отметьте, чтобы применить все доступные параметры
`false` (значение по умолчанию) | верный

`'RABTOverhangTolerance'` — Количество пар оснований позволило накладываться с интроном расшифровки стенограммы
`8` (значение по умолчанию) | положительное целое число

`'JunctionAlpha'` — Альфа-значение в биномиальном тесте, чтобы отфильтровать ложно-положительные выравнивания
`0.001` (значение по умолчанию) | скаляр между `0` и `1`

`'LengthCorrection'` — Отметьте, чтобы исправить длиной расшифровки стенограммы
`true` (значение по умолчанию) | `false`

`'MaskFile'` — Имя GTF или файла GFF, содержащего расшифровки стенограммы, чтобы проигнорировать
представьте в виде строки | вектор символов

`'MaxBundleLength'` — Максимальная геномная длина в парах оснований для пакета
`3500000` (значение по умолчанию) | положительное целое число

`'MaxFragAlignments'` — Максимальное количество выровненных чтений, чтобы включать для каждого фрагмента
`Inf` (значение по умолчанию) | положительное целое число

`'MaxIntronLength'` — Максимальное количество основ в интроне
`300000` (значение по умолчанию) | положительное целое число

`'MaxMLEIterations'` — Максимальное количество итераций для оценки наибольшего правдоподобия
`5000` (значение по умолчанию) | положительное целое число

`'MinFragsPerTransfrag'` — Минимальное количество выровненных фрагментов RNA-Seq, чтобы сообщить
`10` (значение по умолчанию) | положительное целое число

`'MinIntronLength'` — Минимальное количество пар оснований для интрона в геноме
`50` (значение по умолчанию) | положительное целое число

`'MinIsoformFraction'` — Значение Каффофф, чтобы сообщить о распространенности изоформы
`0.1` (значение по умолчанию) | скаляр между `0` и `1`

`'MultiReadCorrection'` — Отметьте, чтобы улучшить оценку распространенности с помощью спасательного метода
`false` (значение по умолчанию) | `true`

`'NormalizeTotalHits'` — Отметьте, чтобы включать все фрагменты, чтобы вычислить значения FPKM
`false` (значение по умолчанию) | `true`

`'NumFragAssignmentDraws'` — Количество присвоений фрагмента, чтобы выполнить на каждой расшифровке стенограммы
`50` (значение по умолчанию) | положительное целое число

`'NumFragDraws'` — Количество ничьих от отрицательного биномиального генератора случайных чисел
`100` (значение по умолчанию) | положительное целое число

`'NumThreads'` — Количество параллельных потоков, чтобы использовать
`1` (значение по умолчанию) | положительное целое число

`'OutputDirectory'` — Директория, чтобы сохранить результаты анализа
текущий каталог (`"./"`) (значение по умолчанию) | представляет в виде строки | вектор символов

`'OverhangTolerance'` — Количество пар оснований перекрытия с интроном
`8` (значение по умолчанию) | положительное целое число

`'OverlapRadius'` — Расстояние между transfrags
`50` (значение по умолчанию) | положительное целое число

`'PreMRNAFraction'` — Порог, чтобы включать выравнивания в интронные интервалы
`0.15` (значение по умолчанию) | скаляр между `0` и `1`

`'ReferenceGTF'` — Имя GTF или файла GFF, содержащего ссылочную аннотацию
представьте в виде строки | вектор символов

`'Seed'` — Отберите для генератора случайных чисел
`0` (значение по умолчанию) | неотрицательное целое число

`'SmallAnchorFraction'` — Минимальный процент выравнивания на каждой стороне соединения соединения встык
`0.09` (значение по умолчанию) | скаляр между `0` и `1`

`'TranscriptPrefix'` — Префикс для transfrags, о котором сообщают, в файле вывода GTF
`"CUFF"` (значение по умолчанию) | представляет в виде строки | вектор символов

`'TrimCoverageThreshold'` — Минимальное среднее покрытие необходимо для 3' обрезки
`10` (значение по умолчанию) | положительное целое число

`'TrimDropoffFraction'` — Минимальный процент среднего покрытия
`0.1` (значение по умолчанию) | скаляр между `0` и `1`

`transcripts` — Имя файла расшифровки стенограммы
`"./transcripts.gtf"` (значение по умолчанию)

`isoforms` — Предполагаемое имя файла выражения уровня изоформы
`"./isoforms.fpkm_tracking.gtf"` (значение по умолчанию)

`genes` — Предполагаемое имя файла выражения генного уровня
`"./genes.fpkm_tracking.gtf"` (значение по умолчанию)

`skippedTranscripts` — Имя файла, содержащего пропущенные расшифровки стенограммы
`"./skipped.gtf"` (значение по умолчанию)