Импорт данных

Импорт данных секвенирования следующего поколения (NGS) и примечаний к функциям из файлов SAM, BAM, FASTA, FASTQ, GTF и GFF

Импорт данных NGS, хранящихся в различных форматах файлов, таких как файлы FASTA, FASTQ, SAM и BAM. Считывайте аннотации функций из файлов GTF и GFF. Используйте различные объекты для доступа к данным NGS и управления ими. Для образца, BioIndexedFile Объект позволяет эффективно обращаться к текстовым файлам с элементами неоднородного размера, такими как последовательности и аннотации. Используйте объект для доступа к отдельным записям или подмножеству записей, когда исходный файл слишком велик, чтобы помещаться в памяти. Используйте BioMap и BioRead объекты для хранения и управления данными чтения последовательности, содержащими информацию о заголовках, качествах и выравниваниях.

Функции

расширить все

fastainfoВозврат информации о файле FASTA
fastareadСчитайте данные из файла FASTA
fastawriteЗапись в файл в формате FASTA
fastqinfoВозврат информации о файле FASTQ
fastqreadСчитайте данные из файла FASTQ
fastqwriteЗапись в файл в формате FASTQ
saminfoВозвращает информацию о файле SAM
samsortСортировка файлов SAM
samreadЧтение данных из файла SAM
baminfoВозвращает информацию о файле BAM
bamreadЧтение данных из файла BAM
bamsortСортировка файлов BAM
bamindexreadЧтение Индекса, BAI, файла

Классы

расширить все

BioReadСодержат чтение последовательности и их данные о качестве
BioMapСодержат данные последовательности, качества, выравнивания и отображения
BioIndexedFileОбеспечьте быстрый и эффективный доступ к большому текстовому файлу с записями неоднородного размера
GFFAnnotationСодержит аннотации общего формата функций (GFF)
GTFAnnotationАннотации в формате переноса генов (GTF)
cuffgffreadФильтрация и преобразование файлов GFF и GTF
cuffgtf2samПреобразуйте файлы GTF в файлы SAM

Темы

Работа с данными секвенирования следующего поколения

Использование BioIndexedFile объекты для извлечения записей из больших файлов с помощью индексов или ключей и анализа данных с помощью пользовательских функций.

Управление данными чтения последовательности в объектах

Использование BioMap и BioRead объекты для доступа к данным секвенирования следующего поколения (NGS) и управления ими из различных форматов файлов, таких как файлы FASTQ, SAM и BAM.

Хранение и управление аннотациями функций

Используйте объекты аннотации функций GTF и GFF для извлечения информации об функциях из одной или нескольких ссылочных последовательностей.

Форматы данных и базы данных

Доступ к онлайновым базам данных и репозиториям с помощью различных MATLAB® функций и импорта данных в рабочую область для последующих анализов.

Визуализация данных NGS с помощью приложения Genomics Viewer

Используйте приложение Genomics Viewer, чтобы просмотреть данные выравнивания NGS для одиночных нуклеотидных изменений в гене цитохрома p450.

Рекомендуемые примеры