Класс BioReadQualityStatistics

Суперклассы:

Качественная статистика из файла последовательности короткого чтения

Этот объект будет удален в будущем релизе. Используйте seqqcplot вместо этого, чтобы сгенерировать графики контроля качества для данных о последовательности.

Описание

Класс BioReadQualityStatistics содержит качественные данные о статистике из последовательностей короткого чтения и обеспечивает стандартный набор графиков контроля качества для таких данных.

Создайте объект BioReadQualityStatistics из данных о последовательности короткого чтения, хранимых в FASTQ, СЭМЕ или файлах BAM. Выполните исследования качества данных с помощью методов объекта, чтобы сгенерировать несколько графиков контроля качества относительно счета среднего качества к каждому основному положению, распределению счета среднего качества, проценту количества чтения для каждого основного положения, проценту нуклеотидов GC для каждого основного положения, распространения контента GC и всего распределения нуклеотида. Объект позволяет вам проанализировать файл последовательности, не создавая объект BioRead и взаимодействовать с качественными данными в порядке сравнить различные наборы данных или опции фильтрации и создать настроенные графики.

Конструкция

QSObj = BioReadQualityStatistics(File) построения QSObj, объект BioReadQualityStatistics, от данных, хранимых в File, FASTQ-, СЭМЕ - или отформатированном BAM файле.

QSObj = BioReadQualityStatistics(Obj) построения QSObj, объект BioReadQualityStatistics, от данных, хранимых в Obj, объекте BioRead или BioMap.

QSObj = BioReadQualityStatistics(___,Name,Value) создает объект BioReadQualityStatistics с помощью опций, заданных одним или несколькими аргументами пары "имя-значение".

Примечание

После того, как созданный, вы не можете изменить свойства QSObj, поскольку это - неизменяемый объект.

Входные параметры

развернуть все

File

Вектор символов или строка, задающая файл FASTQ. Можно также включать путь или местоположение папки файла.

Obj

Объект BioRead или BioMap.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Формат кодировки, заданный как 'Sanger', 'Illumina13', 'Illumina15', 'Illumina18' или 'Solexa'. Это - формат, который используется для символов, кодирующих информацию о последовательности и качественные очки в файле FASTQ.

Пример: 'Encoding','Sanger'

Количество символов, заданных как положительное целое число, от каждого чтения, которое будет использоваться. Никакая фильтрация не применяется, если вы используете пустой массив, который является значением по умолчанию.

Пример: 'FilterLength',40

Порог среднего качества, заданный как вещественное число. Любое чтение со средней оценкой меньше, чем заданный порог проигнорировано.

Пример: 'QualityScoreThreshold', 10

Свойства

FileName

Имя файла раньше создавало объект BioReadQualityStatistics.

FileType

Тип файла, из которого создается объект BioReadQualityStatistics. Поддерживаемыми типами файлов является FASTQ, СЭМ и форматы BAM.

Encoding

Вектор символов или строка, задающая формат информации о последовательности кодировки символов и качественных очков в файле. Поддерживаемые форматы: 'Sanger', 'Illumina13', 'Illumina15', 'Illumina18' и 'Solexa'. Форматом по умолчанию является 'Illumina18'.

CharOffset

Целочисленный код ASCII определения, где качественный счет начинается для последовательности.

NumberOfReads

Целое число, представляющее количество объекта BioReadQualityStatistics последовательностей короткого чтения, содержит.

MaxReadLength

Целое число, представляющее максимальную длину последовательности короткого чтения среди всех последовательностей объекта BioReadQualityStatistics.

MinEncodingPhred

Целое число, задающее минимальный качественный счет Phred [1] среди всех последовательностей короткого чтения объекта BioReadQualityStatistics.

MaxEncodingPhred

Целое число, задающее максимальное качество Phred, выигрывает среди всех последовательностей короткого чтения объекта BioReadQualityStatistics.

SkipPhred

Целое число, задающее количество очков Phred, которые не рассматриваются в качественной области значений счета.

PerSeqAverageQualityDist

Вектор целых чисел, представляющих распределение среднего качества на последовательность.

PerPosQualities

матрица s-by-p целых чисел, которые представляют качественные очки (очки) на основные положения (p).

PerSeqGCDist

Вектор целых чисел, представляющих распределение нуклеотидов GC на последовательность.

PerPosBaseDist

матрица n-by-p целых чисел, которая представляет распределение всех нуклеотидов (n = 5) на основное положение (p).

Name

Вектор символов, описывающий пользовательское имя для объекта.

MaxScore

Целое число, представляющее максимальное качество последовательности, выигрывает среди всех очков.

MinScore

Целое число, представляющее минимальное качество последовательности, выигрывает среди всех очков.

FilterLength

Положительное целое число, задающее продолжительность каждого чтения, используется в качественном анализе.

QualityScoreThreshold

Скалярное значение, задающее минимальный порог среднего качества для чтения. Любое чтение со средней оценкой меньше, чем заданный порог проигнорировано. Значением по умолчанию является –Inf, который заставляет все чтения быть рассмотренными.

Subset

Вектор целых чисел, задающих индекс для подмножества информации от исходных данных о последовательности, используется в анализе.

Методы

plotPerPositionCountByQualityПостройте части чтений с очками Phred в областях значений
plotPerPositionGCПостройте проценты G или нуклеотидов C в каждом основном положении
plotPerPositionQuality Постройте дистрибутивы счета Phred
plotPerSequenceGCПостройте G или распределение нуклеотида C
plotPerSequenceQualityПостройте распределение очков среднего качества
plotSummaryСтатистика краткого изложения сюжета объекта BioReadQualityStatistics
plotTotalGCПостройте распределение всех нуклеотидов последовательностей короткого чтения

Ссылки

[1] Википедия. (2012). Качественный счет Phred, http://en.wikipedia.org/wiki/Phred_quality_score

Смотрите также

|