seqshowwords

Графически отобразите слова в последовательности

Синтаксис

Struct = seqshowwords(Seq, Word)
seqshowwords(Seq, Word, ...'Color', ColorValue, ...)
seqshowwords(Seq, Word, ...'Columns', ColumnsValue, ...)
seqshowwords(Seq, Word, ...'Alphabet', AlphabetValue, ...)

Описание

Struct = seqshowwords(Seq, Word) открывает отдельное окно, отображающее последовательность со всеми случаями одного или нескольких подсвеченных слов. Это также возвращает структуру, содержащую запуск и положения остановки для всех случаев слов в последовательности.

seqshowwords(Seq, Word, ...'PropertyName', PropertyValue, ...) вызывает seqshowwords с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарные кавычки. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:

seqshowwords(Seq, Word, ...'Color', ColorValue, ...) задает цвет, чтобы подсветить слова в выходном отображении последовательности. Значение по умолчанию является красным.

seqshowwords(Seq, Word, ...'Columns', ColumnsValue, ...) задает сколько столбцов или символов на строку в выходном отображении последовательности. Значением по умолчанию является 64.

seqshowwords(Seq, Word, ...'Alphabet', AlphabetValue, ...) задает алфавит для последовательности и слова или слов. Выбором является 'AA' или 'NT' (значение по умолчанию).

Входные параметры

Seq

Аминокислота или последовательность нуклеотида, заданная любым следующим:

Word

Один или несколько закорачивает аминокислоту или последовательности нуклеотида, заданные любым следующим:

  • Вектор символов или строка букв

  • Регулярное выражение (MATLAB)

  • Массив ячеек из символьных векторов, вектор строки или регулярные выражения

Примечание

Если поисковое слово или слова содержат аминокислоту IUB/IUPAC или символы нуклеотида, которые сопоставляют с несколькими нуклеотидами или аминокислотами, то seqshowwords показывает все возможные соответствия. Для получения дополнительной информации о том, как символы интерпретированы, смотрите Преобразование Преобразования и Аминокислоты Нуклеотида. Например, символ R представляет или G или A. Если Word является 'ART', то seqshowwords показывает случаи и 'AAT' и 'AGT'.

Совет

Если Word содержит повторяющийся шаблон, такой как 'TATA', то seqshowwords не подсвечивает перекрывающиеся шаблоны TA в последовательности. Чтобы подсветить несколько повторений TA в последовательности, используйте регулярное выражение, такое как 'TA(TA)*TA', для Word. Для получения дополнительной информации смотрите Примеры.

ColorValue

Цвет, чтобы подсветить все случаи одного или нескольких слов в последовательности. Задайте цвет с одним из следующего:

  • Трехэлементный числовой вектор значений RGB

  • Вектор символов или строка, содержащая предопределенный однобуквенный цветовой код

  • Вектор символов или строка, содержащая предопределенное название цвета

Например, чтобы использовать голубой, введите [0 1 1], 'c' или 'cyan'. Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Значение по умолчанию: Красный, который задан [1 0 0], 'r' или 'red'

ColumnsValue

Положительное целое число, задающее, сколько столбцов или символов на строку в выходном отображении последовательности.

Значение по умолчанию: 64

AlphabetValue

Вектор символов или строка, задающая тип последовательностей. Выбором является 'AA' или 'NT' (значение по умолчанию).

Выходные аргументы

Struct

Структура MATLAB, содержащая запуск и положения остановки всех случаев или слова или слов в последовательности. Это включает два поля.

Поле Описание
StartВектор - строка, содержащий положение запуска каждого вхождения поискового слова или слов.
StopВектор - строка, содержащий положение остановки каждого вхождения поискового слова или слов.

Примеры

Ищите слово, содержащее несколько символов:

% Highlight the word 'BART' which represents 'TAGT' and 'TAAT'
seqshowwords('GCTAGTAACGTATATATAAT','BART')

ans = 
    Start: [3 17]
     Stop: [6 20]

Ищите слово, которое повторяется, исключая перекрытия:

% Highlight all occurrences of 'TATA', excluding those that are  
% already part of another matched word.
seqshowwords('GCTATAACGTATATATATA','TATA')

ans = 
    Start: [3 10 14]
     Stop: [6 13 17]

Ищите слово, которое повторяется, включая перекрытия:

% Use the regular expression 'TA(TA)*TA' to highlight all multiple 
% repeats of 'TA'
seqshowwords('GCTATAACGTATATATATA','TA(TA)*TA')

ans = 
    Start: [3 10]
     Stop: [6 19]

Поиск нескольких слов:

% Use a cell array as input to highlight both the words 
% 'CG' and 'GC'
seqshowwords('GCTATAACGTATATATATA',{'CG', 'GC'})
ans = 

    Start: [1 8]
     Stop: [2 9]

Больше о

свернуть все

Параметры цвета

Следующие списки предопределенные цвета и их эквиваленты триплета RGB. Краткие названия и длинные имена являются векторами символов, которые задают один из восьми предварительно установленных цветов. Триплет RGB является трехэлементным вектором - строкой, элементы которого задают интенсивность красных, зеленых, и синих компонентов цвета; интенсивность должна быть в области значений [0 1].

Триплет RGB

Краткое название

Длинное имя

[1 1 0]

y

yellow

[1 0 1]

m

magenta

[0 1 1]

c

cyan

[1 0 0]

r

red

[0 1 0]

g

green

[0 0 1]

b

blue

[1 1 1]

w

white

[0 0 0]

k

black

Альтернативы

Функция seqviewer открывает Биологический Sequence Viewer, где вы ищете слова в последовательности путем выбора Sequence > Find Word. Биологический Sequence Viewer не делает:

  • Позвольте искать несколько слов за один шаг

  • Возвратите структуру, содержащую запуск и положения остановки для всех случаев слова в последовательности

Представлено до R2006a