exponenta event banner

Импорт данных

Импорт данных и аннотаций элементов NGS из файлов SAM, BAM, FASTA, FASTQ, GTF и GFF

Импорт данных NGS, хранящихся в различных форматах файлов, таких как FASTA, FASTQ, SAM и BAM. Считывание аннотаций элементов из файлов GTF и GFF. Для доступа к данным NGS и управления ими используются различные объекты. Например, BioIndexedFile объект позволяет эффективно обращаться к текстовым файлам с записями неоднородного размера, такими как последовательности и аннотации. Объект используется для доступа к отдельным записям или подмножеству записей, если исходный файл слишком велик для размещения в памяти. Используйте BioMap и BioRead объекты для хранения и управления данными считывания последовательности, содержащими информацию о заголовках, качествах и выравниваниях.

Функции

развернуть все

fastainfoВозврат информации о файле FASTA
fastareadСчитывание данных из файла FASTA
fastawriteЗапись в файл в формате FASTA
fastqinfoВозврат информации о файле FASTQ
fastqreadСчитывание данных из файла FASTQ
fastqwriteЗапись в файл в формате FASTQ
saminfoВозврат информации о файле SAM
samsortСортировка файлов SAM
samreadСчитывание данных из файла SAM
baminfoВозврат информации о файле BAM
bamreadСчитывание данных из файла BAM
bamsortСортировка файлов BAM
bamindexreadЧтение индекса BAM, BAI, файл

Классы

развернуть все

BioReadСодержат данные о считывании последовательностей и их качестве
BioMapСодержат данные о последовательности, качестве, выравнивании и сопоставлении
BioIndexedFileБыстрый и эффективный доступ к большому текстовому файлу с неуниформными записями
GFFAnnotationСодержать аннотации в формате GFF
GTFAnnotationСодержать аннотации формата переноса генов (GTF)
cuffgffreadФильтрация и преобразование файлов GFF и GTF
cuffgtf2samПреобразование файлов GTF в файлы SAM

Темы

Работа с данными секвенирования следующего поколения

Использовать BioIndexedFile объекты для извлечения записей из больших файлов с помощью индексов или ключей и анализа данных с помощью пользовательских функций.

Управление последовательностью чтения данных в объектах

Использовать BioMap и BioRead объекты для доступа и управления данными NGS из различных форматов файлов, таких как FASTQ, SAM и BAM.

Хранение аннотаций элементов и управление ими в объектах

Используйте объекты аннотаций элементов GTF и GFF для извлечения информации об элементах из одной или нескольких последовательностей привязок.

Форматы данных и базы данных

Доступ к интерактивным базам данных и репозиториям с использованием различных функций MATLAB ® и импорт данных в рабочую область для дальнейшего анализа.

Визуализация данных NGS с помощью приложения Genomics Viewer

Используйте приложение Genomics Viewer для просмотра данных выравнивания NGS для однонуклеотидных вариаций в гене цитохрома p450.

Характерные примеры