exponenta event banner

Изучение нуклеотидной последовательности с помощью приложения Sequence Viewer

Обзор средства просмотра последовательностей

Средство просмотра последовательностей интегрирует многие функции последовательности в панель инструментов Toolbox™ биоинформатики. Вместо ввода команд в окне команд MATLAB ® можно выбрать и ввести параметры с помощью приложения.

Импорт последовательности в средство просмотра последовательностей

Первая стадия анализа нуклеотидной или аминокислотной последовательности заключается в импорте информации о последовательности в среду MATLAB. Средство просмотра последовательностей может подключаться к веб-базам данных, таким как NCBI и EMBL, и считывать информацию в среду MATLAB.

Следующая процедура иллюстрирует получение информации о последовательности из базы данных NCBI в Интернете. В этом примере используется регистрационный номер NM_000520 GenBank ®, который представляет собой человеческий ген HEXA, связанный с болезнью Тэя-Сакса.

Примечание

Данные в публичных хранилищах часто обрабатываются и обновляются; поэтому результаты этого примера могут несколько отличаться при использовании актуальных последовательностей.

  1. В окне команды MATLAB введите

    seqviewer

    Либо щелкните Просмотр последовательностей (Sequence Viewer) на вкладке Приложения (Apps).

    Средство просмотра последовательностей открывается без загруженной последовательности. Обратите внимание, что панели справа и снизу пусты.

  2. Для получения последовательности из базы данных NCBI выберите File > Download Sequence from > NCBI.

    Откроется диалоговое окно Загрузить последовательность из NCBI (Download Sequence from NCBI).

  3. В поле Ввод последовательности введите регистрационный номер для записи базы данных NCBI, например, NM_000520. Нажмите кнопку «Параметр нуклеотида» и нажмите кнопку «ОК».

    Программное обеспечение MATLAB получает доступ к базе данных NCBI в Интернете, загружает информацию о нуклеотидной последовательности для введенного номера присоединения и вычисляет некоторые основные статистические данные.

Просмотр информации о нуклеотидной последовательности

После импорта последовательности в приложение Sequence Viewer можно считывать информацию, хранящуюся вместе с последовательностью, или просматривать графические представления для ORF и CSS.

  1. В дереве левой панели щелкните Комментарии. На правой панели отображается общая информация о последовательности.

  2. Теперь щелкните Элементы (Features). На правой панели отображается информация о функциях NCBI, включая номера индексов для гена и все последовательности CDS.

  3. Щелкните ORF, чтобы показать результаты поиска ORF в шести кадрах считывания.

  4. Щелкните Аннотированная CDS, чтобы показать белок, кодирующий часть нуклеотидной последовательности.

Поиск слов

Также можно выполнять поиск характерных слов или шаблонов последовательностей с помощью регулярных выражений. Можно ввести нуклеотидные и аминокислотные символы IUB/IUPAC, которые автоматически преобразуются в соответствующие нуклеотиды и аминокислоты соответственно. Для получения подробной информации о том, как интерпретируются символы, см. таблицы нуклеотидной конверсии и аминокислотной конверсии seq2regexp. Например, при поиске слова 'TAR' если установлен флажок Регулярное выражение, приложение выделяет все вхождения 'TAA' и 'TAG' в последовательности с R = [AG].

  1. Выберите «Последовательность» > «Найти слово».

  2. В диалоговом окне Найти слово (Find Word) введите слово или шаблон последовательности, например, atg, и нажмите кнопку Найти (Find).

    Средство просмотра последовательностей выполняет поиск и отображает местоположение выбранного слова.

  3. Снимите флажок «Очистить выбор слова» на панели инструментов.

Изучение открытых рамок чтения

Следующая процедура иллюстрирует, как идентифицировать белок, кодирующий часть нуклеотидной последовательности, и скопировать его в новое представление. Идентификация кодирующих участков нуклеотидной последовательности является общей задачей биоинформатики. После определения местоположения кодирующей части последовательности можно скопировать ее в новое представление, перевести в аминокислотную последовательность и продолжить анализ.

  1. На левой панели нажмите кнопку ORF.

    Средство просмотра последовательностей отображает ORF для шести кадров чтения на правой нижней панели. Наведите курсор на рамку для отображения информации о ней.

  2. Щелкните самый длинный ORF на рамке считывания 2.

    ОРФ подсвечивается для указания выбранной части последовательности.

  3. Щелкните правой кнопкой мыши выбранный ORF и выберите Экспортировать в рабочую область (Export to Workspace). В диалоговом окне Экспорт в рабочую область MATLAB (Export to MATLAB Workspace) введите имя переменной, например, NM_000520_ORF_2, а затем щелкните Экспорт (Export).

    Переменная NM_000520_ORF_2 добавляется в рабочую область MATLAB.

  4. Выберите меню «Файл» > «Импорт из рабочей области». Введите имя переменной с экспортированным ORF, например NM_000520_ORF_2, и нажмите кнопку Импорт.

    Средство просмотра последовательностей добавляет вкладку в нижней части новой последовательности, оставляя исходную последовательность открытой.

  5. На левой панели щелкните Полный перевод. Выберите Отображение > Отображение аминокислотного остатка > Однобуквенный код.

    Средство просмотра последовательностей отображает аминокислотную последовательность ниже нуклеотидной последовательности.

Закрытие средства просмотра последовательностей

Закройте средство просмотра последовательностей из командной строки MATLAB, используя следующий синтаксис:

seqviewer('close')