exponenta event banner

seqsplitpe

Разделение объединенных парных последовательностей на отдельные файлы

Описание

пример

seqsplitpe(fastqFile) разделяет объединенные парные концевые последовательности из fastqFile в два отдельных файла. Каждая последовательность разделена посередине. Первая половина последовательности сохраняется в первом выходном файле, а другая половина - во втором выходном файле. По умолчанию каждое имя выходного файла состоит из имени входного файла, добавленного с суффиксом '_1' или '_2' перед расширением файла.

пример

seqsplitpe(___,Name,Value) использует дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары.

пример

[outFiles,N] = seqsplitpe(___) возвращает имена выходных файлов в массиве ячеек outFiles. N представляет вектор, содержащий количество последовательностей, сохраненных в каждом выходном файле.

Примеры

свернуть все

Разделите каждую из последовательностей парных концов пополам и сохраните каждую половину в отдельных выходных файлах.

[outFiles, N] = seqsplitpe('SXX123456_merged.fastq');

Проверьте количество последовательностей в каждом выходном файле.

N
N = 2×1

    50
    50

Входные аргументы

свернуть все

Имена файлов FASTQ с информацией о последовательности и качестве, заданными как символьный вектор, строка, строковый вектор или массив ячеек символьных векторов.

Пример: 'SRR005164_1_50.fastq'

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: 'OutputSuffix','PairedEnd_split' задает использование пользовательского суффикса в именах выходных файлов.

Относительный или абсолютный путь к каталогу выходного файла, указанный как символьный вектор или строка. По умолчанию используется текущий каталог.

Пример: 'OutputDir','F:\results'

Пользовательский суффикс для использования в именах выходных файлов, указанный как символьный вектор или строка. Вставляется после имени входного файла и перед суффиксом '_1' или '_2'. Значение по умолчанию: ''.

Пример: 'OutputSuffix','_MisMatches2'

Логическое значение, указывающее, следует ли выполнять вычисления параллельно, указанное как true или false.

Для параллельных вычислений необходимо иметь Toolbox™ Parallel Computing. Если параллельный пул не существует, он создается автоматически, если в настройках параллельного создания включена опция автоматического создания. В противном случае вычисления выполняются в последовательном режиме.

Примечание

Существует стоимость совместного использования больших входных файлов сотрудниками в распределенной среде. В некоторых случаях параллельная работа может оказаться неэффективной с точки зрения производительности.

Пример: 'UseParallel',true

Выходные аргументы

свернуть все

Имена выходных файлов, возвращаемые в виде массива ячеек символьных векторов. По умолчанию имя каждого выходного файла состоит из имени входного файла, добавленного с суффиксом '_1' или '_2' перед расширением файла.

Количество последовательностей, сохраненных в каждом выходном файле, возвращаемое в виде n-by-1 вектор, где n - количество выходных файлов. При наличии нескольких выходных файлов порядок внутри N соответствует порядку выходных файлов.

Расширенные возможности

См. также

| |

Представлен в R2016b