aacount

Считайте аминокислоты в последовательности

Синтаксис

AAStruct = aacount(SeqAA)
AAStruct = aacount(SeqAA, ...'Ambiguous', AmbiguousValue, ...)
AAStruct = aacount(SeqAA, ...'Gaps', GapsValue, ...)
AAStruct = aacount(SeqAA, ...'Chart', ChartValue, ...)

Входные параметры

SeqAA

Одно из следующего:

  • Вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот. Для допустимых алфавитных кодов см. таблицу Mapping Amino Acid Letter Codes to Integers. Неизвестные символы сопоставлены с 0.

  • Вектор - строка из целых чисел, задающих последовательность аминокислот. Для допустимых целых чисел см. таблицу Mapping Amino Acid Integers to Letter Codes.

  • Структура MATLAB®, содержащая поле Sequence, которое содержит последовательность аминокислот, такой, как возвращено fastaread, getgenpept, genpeptread, getpdb или pdbread.

Примеры: 'ARN' или [1 2 3]

AmbiguousValue

Вектор символов или строка, задающая, как обработать неоднозначные символы аминокислоты (B, Z или X). Выбор:

  • 'ignore' (значение по умолчанию) — Пропуски неоднозначные символы

  • 'bundle' — Считает неоднозначные символы и сообщает об общем количестве в поле Ambiguous.

  • 'prorate' — Считает неоднозначные символы и распределяет их пропорционально в соответствующих полях. Например, счета для символьного B распределяются равномерно между полями D и N.

  • 'individual' — Считает неоднозначные символы и сообщает о них в отдельных полях.

  • 'warn' — Пропускает неоднозначные символы символов и выводит предупреждение.

GapsValue

Задает, считаются ли разрывы, обозначенные дефисом (-), или игнорируются. Выбором является true или false (значение по умолчанию).

ChartValue Вектор символов или строка, задающая тип диаграммы. Выбором является 'pie' или 'bar'.

Выходные аргументы

AAStructСтруктура MATLAB 1 на 1, содержащая поля для стандартных 20 аминокислот (A, R, N, D, C, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y и V).

Описание

AAStruct = aacount(SeqAA) считает количество каждого типа аминокислоты в SeqAA, последовательности аминокислот, и возвращает количества в AAStruct, структура MATLAB 1 на 1, содержащая поля для стандартных 20 аминокислот (A, R, N, D, C, Q, E, G, H, I, L, K, M, F, P, S, T, W, Y и V).

  • Неоднозначные символы аминокислоты (B, Z или X), разрывы, обозначенные дефисом (-) и терминаторы строки конца (*), проигнорированы по умолчанию.

  • Нераспознанные символы проигнорированы и вызывают следующее предупреждающее сообщение.

    Warning: Unknown symbols appear in the sequence. These will be ignored.

AAStruct = aacount(SeqAA, ...'PropertyName', PropertyValue, ...) вызывает aacount с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

AAStruct = aacount(SeqAA, ...'Ambiguous', AmbiguousValue, ...) задает, как обработать неоднозначные символы аминокислоты (B, Z или X). Выбор:

  • 'ignore' (значение по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'individual'

  • 'warn'

AAStruct = aacount(SeqAA, ...'Gaps', GapsValue, ...) задает, считаются ли разрывы, обозначенные дефисом (-), или игнорируются. Выбором является true или false (значение по умолчанию).

AAStruct = aacount(SeqAA, ...'Chart', ChartValue, ...) создает график, показывающий относительные пропорции аминокислот. ChartValue может быть 'pie' или 'bar'.

Примеры

свернуть все

Используйте функцию fastaread, чтобы загрузить последовательность человеческого p53 белка опухоли.

p53 = fastaread('p53aa.txt')
p53 = struct with fields:
      Header: 'gi|8400738|ref|NP_000537.2| tumor protein p53 [Homo sapiens]'
    Sequence: 'MEEPQSDPSVEPPLSQETFSDLWKLLPENNVLSPLPSQAMDDLMLSPDDIEQWFTEDPGPDEAPRMPEAAPRVAPAPAAPTPAAPAPAPSWPLSSSVPSQKTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQLWVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRRPILTIITLEDSSGNLLGRNSFEVRVCACPGRDRRTEEENLRKKGEPHHELPPGSTKRALPNNTSSSPQPKKKPLDGEYFTLQIRGRERFEMFRELNEALELKDAQAGKEPGGSRAHSSHLKSKKGQSTSRHKKLMFKTEGPDSD'

Считайте аминокислоты в последовательности и отобразите результаты в круговой диаграмме.

count = aacount(p53,'Chart','pie');

Представлено до R2006a