Исследование нуклеотидной последовательности с помощью приложения Sequence Viewer

Обзор программы Sequence Viewer

Этот Sequence Viewer интегрирует многие функции последовательности в тулбоксе Bioinformatics Toolbox™. Вместо ввода команд в MATLAB® Командное окно, вы можете выбрать и ввести опции с помощью приложения.

Импорт последовательности в Sequence Viewer

Первый этап анализа нуклеотидной или аминокислотной последовательности заключается в импорте информации о последовательности в окружение MATLAB. Sequence Viewer может подключаться к веб-базам данных, таким как NCBI и EMBL, и считывать информацию в окружение MATLAB.

Следующая процедура иллюстрирует, как получить информацию о последовательности из базы данных NCBI в Интернете. Этот пример использует GenBank®число NM_000520 присоединения, который является геном человека HEXA, который связан с болезнью Tay-Sachs.

Примечание

Данные в общественных хранилищах часто хранятся и обновляются; поэтому результаты этого примера могут несколько отличаться при использовании современных последовательностей.

  1. В Командном Окне MATLAB введите

    seqviewer

    Также щелкните Sequence Viewer на вкладке Apps.

    Sequence Viewer открывается без загруженной последовательности. Заметьте, что панели справа и снизу являются пустыми.

  2. Чтобы получить последовательность из базы данных NCBI, выберите File > Download Sequence from > NCBI.

    Откроется диалоговое окно Загрузка последовательности из NCBI.

  3. В поле Enter Sequence введите номер доступа для записи базы данных NCBI, например, NM_000520. Нажмите кнопку Nucleotide опции и нажмите OK.

    MATLAB обращается к базе данных NCBI в Сети, загружает информацию о нуклеотидной последовательности для введенного вами номера присоединения и вычисляет некоторую базовую статистику.

Просмотр информации о нуклеотидной последовательности

После импорта последовательности в приложение Sequence Viewer можно считать информацию, сохраненную в последовательности, или можно просмотреть графические представления для ORF и CDS.

  1. В дереве левой панели нажмите Comments. На правой панели отображаются общие сведения о последовательности.

  2. Теперь нажмите Features. Правая панель отображает информацию о функциях NCBI, включая номера индексов для гена и любых последовательностей CDS.

  3. Щелкните ORF, чтобы показать результаты поиска ORF в шести системах координат чтения.

  4. Щелкните Annotated CDS, чтобы показать кодирующую белок часть нуклеотидной последовательности.

Поиск слов

Вы также можете искать характерные слова или шаблоны последовательности с помощью регулярных выражений. Можно ввести нуклеотидные и аминокислотные символы IUB/IUPAC, которые автоматически преобразуются в соответствующие нуклеотиды и аминокислоты соответственно. Для получения дополнительной информации о том, как символы интерпретируются, смотрите таблицы Нуклеотидного преобразования и аминокислотного преобразования seq2regexp. Например, если вы ищете слово 'TAR' при установленном Regular Expression поле приложение подсвечивает все вхождения 'TAA' и 'TAG' в последовательности с R = [AG].

  1. Выберите Sequence > Find Word.

  2. В диалоговом окне Find Word введите слово или шаблон последовательности, например, atg, а затем нажмите Find.

    В Sequence Viewer выполняется поиск и отображение местоположения выбранного слова.

  3. Очистить отображение можно нажав кнопку Clear Word Selection на панели инструментов.

Исследование открытых систем координат чтения

Следующая процедура иллюстрирует, как идентифицировать белковую кодирующую часть нуклеотидной последовательности и скопировать ее в новое представление. Идентификация кодирующих участков нуклеотидной последовательности является обычной задачей биоинформатики. После определения местоположения кодирующей части последовательности можно скопировать ее в новое представление, преобразовать ее в аминокислотную последовательность и продолжить анализ.

  1. На левой панели нажмите ORF.

    В Sequence Viewer отображаются ORF для шести систем координат на правой нижней панели. Наведите курсор на систему координат, чтобы отобразить информацию о нем.

  2. Щелкните самый длинный ORF при чтении системы координат 2.

    ORF подсвечивается для указания выбранной части последовательности.

  3. Щелкните правой кнопкой мыши выбранный ORF и выберите Export to Workspace. В диалоговом окне «Экспорт в рабочее пространство MATLAB» введите имя переменной, например, NM_000520_ORF_2, затем нажмите Export.

    Переменная NM_000520_ORF_2 добавляется к Рабочему пространству MATLAB.

  4. Выберите File > Import from Workspace. Введите имя переменной с экспортированным ORF, например, NM_000520_ORF_2, и нажмите Import.

    Эта Sequence Viewer добавляет вкладку внизу для новой последовательности, оставляя исходную последовательность открытой.

  5. На левой панели нажмите Full Translation. Выберите Display > Amino Acid Residue Display > One Letter Code.

    Этот Sequence Viewer показывает аминокислотную последовательность ниже нуклеотидной последовательности.

Закрытие программы Sequence Viewer

Закройте Sequence Viewer из командной строки MATLAB с помощью следующего синтаксиса:

seqviewer('close')