Toolbox™ биоинформатики позволяет получать доступ ко многим базам данных в Интернете и других сетевых хранилищах данных. Он позволяет копировать данные в рабочую область MATLAB ®, а также выполнять чтение и запись в файлы со стандартными биоинформатическими форматами. Он также считывает многие распространенные форматы файлов генома, чтобы вам не пришлось писать и поддерживать собственные читатели файлов.
Веб-базы данных - можно напрямую обращаться к общедоступным базам данных в Интернете и копировать информацию о последовательности и экспрессии генов в среду MATLAB.
В настоящее время поддерживаются следующие базы данных последовательностей: GenBank ® (getgenbank), ГенПепт (getgenpept), Европейская лаборатория молекулярной биологии (EMBL) (getembl) и банк данных белка (PDB) (getpdb). Вы также можете получить доступ к данным с веб-сайта NCBI Gene Expression Omnibus (GEO), используя одну функцию (getgeodata).
Получить несколько выровненных последовательностей (gethmmalignment), скрытые профили модели Маркова (gethmmprof) и данные филогенетического дерева (gethmmtree) из базы данных PFAM.
База данных генной онтологии - загрузка базы данных из Сети в объект генной онтологии (geneont). Выберите разделы онтологии с методами для объекта geneont (getancestors (geneont), getdescendants (geneont), getmatrix (geneont), getrelatives (geneont)) и манипулировать данными с помощью функций утилиты (goannotread, num2goid).
Считывание данных с приборов - считывание данных, полученных с приборов секвенирования генов (scfread, joinseq, traceplot), масс-спектрометры (jcampread) и сканеры микрочипов Agilent ® (agferead).
Чтение форматов данных - панель инструментов предоставляет ряд функций для чтения данных из общих биоинформатических форматов файлов.
Данные последовательности: GenBank (genbankread), ГенПепт (genpeptread), EMBL (emblread), PDB (pdbread) и FASTA (fastaread)
Умножить выровненные последовательности: форматы ClustalW и GCG (multialignread)
Данные экспрессии генов из микрочипов: Данные Omnibus по экспрессии генов (GEO) (geosoftread), данные GenePix ® в файлах GPR и GAL (gprread, galread), данные SPOT (СПОТ) (sptread), данные Affymetrix ® GeneChip ® (affyread) и файлы результатов ImaGene ® (imageneread)
Скрытые профили модели Маркова: файл PFAM-HMM (pfamhmmread)
Формат записи данных - функции для получения данных из Интернета включают возможность сохранения данных в файле. Однако существует функция записи данных в файл с использованием формата FASTA (fastawrite).
Поиск BLAST - запрос веб-поиска BLAST (blastncbi), получить результаты поиска (getblast) и прочтите результаты из ранее сохраненного файла отчета в формате BLAST (blastread).
Среда MATLAB имеет встроенную поддержку других стандартных форматов файлов, включая файлы Microsoft ® Excel ® и CSV. Дополнительные функции выполняют ASCII и низкоуровневый двоичный ввод-вывод, позволяя разрабатывать пользовательские функции для работы с любым форматом данных.