Этот Sequence Viewer интегрирует многие функции последовательности в тулбоксе Bioinformatics Toolbox™. Вместо ввода команд в MATLAB® Командное окно, вы можете выбрать и ввести опции с помощью приложения.
Первый этап анализа нуклеотидной или аминокислотной последовательности заключается в импорте информации о последовательности в окружение MATLAB. Sequence Viewer может подключаться к веб-базам данных, таким как NCBI и EMBL, и считывать информацию в окружение MATLAB.
Следующая процедура иллюстрирует, как получить информацию о последовательности из базы данных NCBI в Интернете. Этот пример использует GenBank®число NM_000520 присоединения, который является геном человека HEXA, который связан с болезнью Tay-Sachs.
Примечание
Данные в общественных хранилищах часто хранятся и обновляются; поэтому результаты этого примера могут несколько отличаться при использовании современных последовательностей.
В Командном Окне MATLAB введите
seqviewer
Также щелкните Sequence Viewer на вкладке Apps.
Sequence Viewer открывается без загруженной последовательности. Заметьте, что панели справа и снизу являются пустыми.
Чтобы получить последовательность из базы данных NCBI, выберите File > Download Sequence from > NCBI.
Откроется диалоговое окно Загрузка последовательности из NCBI.
В поле Enter Sequence введите номер доступа для записи базы данных NCBI, например, NM_000520. Нажмите кнопку Nucleotide опции и нажмите OK.
MATLAB обращается к базе данных NCBI в Сети, загружает информацию о нуклеотидной последовательности для введенного вами номера присоединения и вычисляет некоторую базовую статистику.
После импорта последовательности в приложение Sequence Viewer можно считать информацию, сохраненную в последовательности, или можно просмотреть графические представления для ORF и CDS.
В дереве левой панели нажмите Comments. На правой панели отображаются общие сведения о последовательности.
Теперь нажмите Features. Правая панель отображает информацию о функциях NCBI, включая номера индексов для гена и любых последовательностей CDS.
Щелкните ORF, чтобы показать результаты поиска ORF в шести системах координат чтения.
Щелкните Annotated CDS, чтобы показать кодирующую белок часть нуклеотидной последовательности.
Вы также можете искать характерные слова или шаблоны последовательности с помощью регулярных выражений. Можно ввести нуклеотидные и аминокислотные символы IUB/IUPAC, которые автоматически преобразуются в соответствующие нуклеотиды и аминокислоты соответственно. Для получения дополнительной информации о том, как символы интерпретируются, смотрите таблицы Нуклеотидного преобразования и аминокислотного преобразования seq2regexp
. Например, если вы ищете слово 'TAR'
при установленном Regular Expression поле приложение подсвечивает все вхождения 'TAA'
и 'TAG'
в последовательности с R = [AG]
.
Выберите Sequence > Find Word.
В диалоговом окне Find Word введите слово или шаблон последовательности, например, atg, а затем нажмите Find.
В Sequence Viewer выполняется поиск и отображение местоположения выбранного слова.
Очистить отображение можно нажав кнопку Clear Word Selection на панели инструментов.
Следующая процедура иллюстрирует, как идентифицировать белковую кодирующую часть нуклеотидной последовательности и скопировать ее в новое представление. Идентификация кодирующих участков нуклеотидной последовательности является обычной задачей биоинформатики. После определения местоположения кодирующей части последовательности можно скопировать ее в новое представление, преобразовать ее в аминокислотную последовательность и продолжить анализ.
На левой панели нажмите ORF.
В Sequence Viewer отображаются ORF для шести систем координат на правой нижней панели. Наведите курсор на систему координат, чтобы отобразить информацию о нем.
Щелкните самый длинный ORF при чтении системы координат 2.
ORF подсвечивается для указания выбранной части последовательности.
Щелкните правой кнопкой мыши выбранный ORF и выберите Export to Workspace. В диалоговом окне «Экспорт в рабочее пространство MATLAB» введите имя переменной, например, NM_000520_ORF_2, затем нажмите Export.
Переменная NM_000520_ORF_2 добавляется к Рабочему пространству MATLAB.
Выберите File > Import from Workspace. Введите имя переменной с экспортированным ORF, например, NM_000520_ORF_2, и нажмите Import.
Эта Sequence Viewer добавляет вкладку внизу для новой последовательности, оставляя исходную последовательность открытой.
На левой панели нажмите Full Translation. Выберите Display > Amino Acid Residue Display > One Letter Code.
Этот Sequence Viewer показывает аминокислотную последовательность ниже нуклеотидной последовательности.
Закройте Sequence Viewer из командной строки MATLAB с помощью следующего синтаксиса:
seqviewer('close')