Приложение Genomics Viewer позволяет вам просмотреть и исследовать интегрированные геномные данные со встроенной версией Integrative Genomics Viewer (IGV) [1][2]. Геномные данные включают выравнивания чтения NGS, варианты генома и сегментированные данные о номере копии.
Первая часть этого примера дает краткий обзор приложения и поддерживаемых форматов файлов. Вторая часть примера исследует одно изменение нуклеотида цитохрома p450 ген (CYP2C19).
В командной строке введите genomicsViewer
. В качестве альтернативы кликните по значку приложения на вкладке Apps. Приложение требует интернет-соединения.
По умолчанию, Человек загрузок приложения (GRCh38/hg38) как ссылочная последовательность и Гены Refseq как файл аннотации. В приложении существует две основных панели. Левая панель является панелью Tracks, и правильная панель является встроенным веб-приложением IGV. Панель Track является областью только для чтения, отображающей имена дорожки, имена исходного файла и типы дорожки. Панель Track обновляется соответственно, когда вы конфигурируете дорожки во встроенном приложении IGV.
Кнопка Reset восстанавливает приложение к представлению по умолчанию с двумя дорожками (HG38 с Генами Refseq) и удаляет любые другие существующие дорожки. Перед сбросом можно сохранить текущее представление как сеанс (.json
) файл и восстановление это позже.
Можно импортировать одну ссылочную последовательность. Ссылочная последовательность должна быть в файле FASTA. Выберите Import Reference на вкладке Home. Можно также импортировать соответствующий cytoband файл, который содержит цитогенетические данные G-соединения. Можно добавить локальные файлы или задать внешние URL. URL Должен запуститься или с https или с gs. Другие протоколы передачи файлов, такие как ftp, не поддержаны.
Можно импортировать несколько наборов данных считанных данных о выравнивании последовательности. Данные о выравнивании должны быть файл CRAM или BAM. Не требуется, что у вас есть соответствующий индексный файл (.BAI
или .CRAI
) в том же месте как ваш BAM или файл CRAM. Однако отсутствие индексного файла сделает приложение медленнее.
Можно добавить файлы выравнивания чтения с помощью Add tracks from file и опций Add tracks from URL от кнопки Add tracks. Если вы задаете URL, URL должен запуститься или с https или с gs. Другие протоколы передачи файлов, такие как ftp, не поддержаны.
Можно импортировать несколько наборов аннотаций функции из нескольких файлов, которые содержат данные для одной ссылочной последовательности. Поддерживаемые файлы аннотации: .BED
, .GFF
, .GFF3
, и .GTF
.
Можно также импортировать структурные варианты (.VCF) и визуализировать генетические изменения, такие как вставки и удаления.
Можно просмотреть сегментированные данные о номере копии (.SEG
) и количественные геномные данные (.WIG
, .BIGWIG
, и .BEDGRAPH
), такие как peaks ChIP и покрытие выравнивания.
Можно добавить аннотацию и геномные файлы данных с помощью Add tracks from file и опций Add tracks from URL от кнопки Add tracks. Если вы задаете URL, URL должен запуститься или с https или с gs. Другие протоколы передачи файлов, такие как FTP, не поддержаны.
Ген CYP2C19 является членом цитохрома семейство генов P450. Ферменты, произведенные из цитохрома гены P450, вовлечены в метаболизм различных молекул и химикатов в ячейках. Фермент CYP2C19 играет роль в усваивании по крайней мере 10 процентов обычно прописываемых лекарств [3]. Полиморфизмы в цитохроме p450 семейство могут вызвать неблагоприятные ответы препарата в индивидуумах. Одним примером одного изменения нуклеотида является rs4986893 в положении chr10:94,780,653 где G
заменяется A
. Этот аллельный вариант также известен как CYP2C19*3. Следующие шаги показывают, как визуализировать такое изменение приложения с помощью и низкого покрытия и высоких данных о покрытии.
В целях этого примера запустите с файла сеанса, который имеет некоторые предварительно загруженные дорожки. Чтобы загрузить файл, нажмите Open. Перейдите к matlabroot\examples\bioinfo\
, где matlabroot является папкой, где вы установили MATLAB®. Выберите rs4986893.json
.
Сеанс содержит три дорожки:
Human (GRCh38/hg38) как ссылка
NA18564 как низкие данные о выравнивании покрытия
Гены Refseq
Низкие данные о выравнивании покрытия прибывают из розеточные ханьцы из Пекина, Китай. Демонстрационным ID является NA18564, и выборка была идентифицирована с мутацией CYP2C19*3 [4].
В этом файле сеанса данные о выравнивании были сосредоточены вокруг местоположения мутации на гене CYP2C19.
Кликните по оранжевой панели в зоне охвата, чтобы посмотреть на положение и информацию о распределении аллели.
Это показывает, что 71% чтений имеет G, в то время как 29% имеют в местоположении chr10:94,780,653. Эти данные являются низкими данными о покрытии и не могут показать все случаи этой мутации. Высокие данные о покрытии будут исследованы позже в примере.
Закройте окно всплывающей подсказки.
Можно настроить различные аспекты отображения данных в приложении. Например, можно изменить высоту дорожки, чтобы сделать больше комнаты для более поздних дорожек. Кликните по второму значку механизма. Выберите Set track height
. Войдите 200.
Для получения дополнительной информации на встроенном приложении IGV и его доступных параметрах, посетите здесь.
Можно посмотреть на высокие данные о покрытии из той же выборки, чтобы видеть случаи этой мутации.
Перейдите к Международному Демонстрационному веб-сайту Ресурса Генома.
Ищите демонстрационный NA18564.
Загрузите файл выравнивания Exome, который находится в .CRAM
формат.
Также загрузите соответствующий индексный файл, который находится в .CRAI
формат. Сохраните файл в том же месте как источник .CRAM
файл.
Щелкните (+) значок на вкладке Home. Выберите загруженный .CRAM
файл и нажимает Open.
Высокие данные о покрытии появляются как track3. Можно теперь видеть много случаев мутации в нескольких чтениях.
Кликните по оранжевой панели в зоне охвата, чтобы видеть распределение аллели. Это показывает, что G заменяется почти в 50% времени.
[1] Робинсон, J., Х. Торволдсдоттир, В. Винклер, М. Гуттман, E. Высаживающийся на берег, Г. Гетц, Й. Месиров. 2011. Интегральный Genomics Viewer. Биотехнология природы. 29:24–26.
[2] Thorvaldsdóttir, H., Дж. Робинсон, Й. Месиров. 2013. Интегральный Genomics Viewer (IGV): высокоэффективная визуализация данных о геномике и исследование. Брифинги в Биоинформатике. 14:178–192.