oligoprop

Вычислите свойства последовательности олигонуклеотида ДНК

Синтаксис

SeqProperties = oligoprop(SeqNT)
SeqProperties = oligoprop(SeqNT, ...'Salt', SaltValue, ...)
SeqProperties = oligoprop(SeqNT, ...'Temp', TempValue, ...)
SeqProperties = oligoprop(SeqNT, ...'Primerconc', PrimerconcValue, ...)
SeqProperties = oligoprop(SeqNT, ...'HPBase', HPBaseValue, ...)
SeqProperties = oligoprop(SeqNT, ...'HPLoop', HPLoopValue, ...)
SeqProperties = oligoprop(SeqNT, ...'Dimerlength', DimerlengthValue, ...)

Входные параметры

SeqNT Последовательность олигонуклеотидов ДНК, представленная любым из следующих:
  • Вектор символов или строка, содержащая буквы A, C, G, T, или N

  • Вектор целых чисел, содержащий целые числа 1, 2, 3, 4, или 15

  • Структура, содержащая Sequence поле, которое содержит нуклеотидную последовательность

SaltValueЗначение, которое определяет концентрацию соли в молях/литре для вычисления температуры плавления. По умолчанию это 0.05 молей/литр.
TempValueЗначение, которое задает температуру в степенях Цельсия для ближайших соседних вычислений свободной энергии. По умолчанию это 25 степени Цельсия.
PrimerconcValueЗначение, которое определяет концентрацию в молях/литре для вычисления температуры плавления. По умолчанию это 50e-6 молей/литр.
HPBaseValueЗначение, которое задает минимальное количество парных основ, образующих шейку шпильки. По умолчанию это 4 базовые пары.
HPLoopValueЗначение, которое задает минимальное количество основ, образующих цикл шпильки. По умолчанию это 2 основы.
DimerlengthValueЗначение, которое задает минимальное количество выровненных основ между последовательностью и ее обратной. По умолчанию это 4 основы.

Выходные аргументы

SeqPropertiesСтруктура, содержащая свойства последовательности для олигонуклеотида ДНК.

Описание

SeqProperties = oligoprop(SeqNT) возвращает свойства последовательности для олигонуклеотида ДНК как структуры со следующими полями:

ОбластьОписание
GCПроцент содержимого GC в ДНК. Неоднозначные N символы в SeqNT считаются потенциально любыми нуклеотидами. Если SeqNT содержит неоднозначные N символы, GC является средним значением, и его неопределенность выражается GCdelta.
GCdeltaПеременное различие между GC (среднее значение) и максимальное или минимальное значение GC может предположить. Максимальное и минимальное значения вычисляются путем принятия всех N символы являются G/C или не G/C, соответственно. Поэтому GCdelta определяет возможную область значений содержимого GC.
HairpinsH-по длине (SeqNT) матрица символов, отображающих все потенциальные структуры шпильки для последовательности SeqNT. Каждая строка является потенциальной структурой шпильки последовательности с образующими шпильки нуклеотидами, обозначенными заглавными буквами. H - количество потенциальных структур шпильки для последовательности. Неоднозначные N символы в SeqNT считаются потенциально дополняющими любой нуклеотид.
Dimers D-по длине (SeqNT) матрица символов, отображающих все потенциальные димеры для последовательности SeqNT. Каждая строка является потенциальным димером последовательности с самодимеризующимися нуклеотидами, обозначенными заглавными буквами. D количество потенциальных димеров для последовательности. Неоднозначные N символы в SeqNT считаются потенциально дополняющими любой нуклеотид.
MolWeightМолекулярная масса олигонуклеотида ДНК. Неоднозначные N символы в SeqNT считаются потенциально любыми нуклеотидами. Если SeqNT содержит неоднозначные N символы, MolWeight является средним значением, и его неопределенность выражается MolWeightdelta.
MolWeightdeltaПеременное различие между MolWeight (среднее значение) и максимальное или минимальное значение MolWeight может предположить. Максимальное и минимальное значения вычисляются путем принятия всех N символы G или C, соответственно. Поэтому MolWeightdelta определяет возможную область значений молекулярного веса для SeqNT.
TmВектор со значениями температуры плавления в степенях Цельсия, рассчитанный шестью различными методами, перечисленными в следующем порядке:

Неоднозначные N символы в SeqNT считаются потенциально любыми нуклеотидами. Если SeqNT содержит неоднозначные N символы, Tm является средним значением, и его неопределенность выражается Tmdelta.

TmdeltaВектор, содержащий различия между Tm (среднее значение) и максимальное или минимальное значение Tm можно предположить для каждого из шести методов. Поэтому Tmdelta определяет возможную область значений температур плавления для SeqNT.
Thermo

4-by- 3 матрица термодинамических вычислений.

Строки соответствуют параметрам ближайшего соседа из:

Столбцы соответствуют:

  • дельта- H - Энтальпия в килокалориях на моль, ккал/моль

  • дельта- S - Энтропия в калориях на моль-градусы Кельвина, кал/( К) (моль)

  • дельта- G - Свободная энергия в килокалориях на моль, ккал/моль

Неоднозначные N символы в SeqNT считаются потенциально любыми нуклеотидами. Если SeqNT содержит неоднозначные N символы, Thermo является средним значением, и его неопределенность выражается Thermodelta.
Thermodelta4-by- 3 матрица, содержащая различия между Thermo (среднее значение) и максимальное или минимальное значение Thermo может предположить для каждого вычисления и метода. Поэтому Thermodelta определяет возможную область значений термодинамических значений для SeqNT.

SeqProperties = олигопроп (SeqNT... 'PropertyName', PropertyValue, ...) вызывает oligoprop с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqProperties = oligoprop(SeqNT, ...'Salt', SaltValue, ...) определяет концентрацию соли в молях/л для вычисления температуры плавления. По умолчанию это 0.05 молей/литр.

SeqProperties = oligoprop(SeqNT, ...'Temp', TempValue, ...) задает температуру в степенях Цельсия для ближайших соседних вычислений свободной энергии. По умолчанию это 25 степени Цельсия.

SeqProperties = oligoprop(SeqNT, ...'Primerconc', PrimerconcValue, ...) определяет концентрацию в молях/л для температур плавления. По умолчанию это 50e-6 молей/литр.

SeqProperties = oligoprop(SeqNT, ...'HPBase', HPBaseValue, ...) задает минимальное количество парных основ, образующих шейку шпильки. По умолчанию это 4 базовые пары.

SeqProperties = oligoprop(SeqNT, ...'HPLoop', HPLoopValue, ...) задает минимальное количество основ, образующих цикл шпильки. По умолчанию это 2 основы.

SeqProperties = oligoprop(SeqNT, ...'Dimerlength', DimerlengthValue, ...) задает минимальное количество выровненных основ между последовательностью и ее противоположной точкой. По умолчанию это 4 основы.

Примеры

Пример 53. Вычисление свойств для последовательности ДНК
  1. Создайте случайную последовательность.

    seq = randseq(25)
    
    seq =
    
    TAGCTTCATCGTTGACTTCTACTAA
  2. Вычислите свойства последовательности.

    S1 = oligoprop(seq)
    
    S1 = 
    
                    GC: 36
               GCdelta: 0
              Hairpins: [0x25 char]
                Dimers: 'tAGCTtcatcgttgacttctactaa'
             MolWeight: 7.5820e+003
        MolWeightdelta: 0
                    Tm: [52.7640 60.8629 62.2493 55.2870 54.0293 61.0614]
               Tmdelta: [0 0 0 0 0 0]
                Thermo: [4x3 double]
           Thermodelta: [4x3 double]
  3. Перечислите термодинамические вычисления для последовательности.

    S1.Thermo
    
    ans =
    
     -178.5000 -477.5700  -36.1125
     -182.1000 -497.8000  -33.6809
     -190.2000 -522.9000  -34.2974
     -191.9000 -516.9000  -37.7863
Пример 54. Вычисление свойств для последовательности ДНК с неоднозначными символами
  1. Вычислите свойства последовательности ACGTAGAGGACGTN.

    S2 = oligoprop('ACGTAGAGGACGTN')
    
    S2 = 
    
                    GC: 53.5714
               GCdelta: 3.5714
              Hairpins: 'ACGTagaggACGTn'
                Dimers: [3x14 char]
             MolWeight: 4.3329e+003
        MolWeightdelta: 20.0150
                    Tm: [38.8357 42.2958 57.7880 52.4180 49.9633 55.1330]
               Tmdelta: [1.4643 1.4643 10.3885 3.4633 0.2829 3.8074]
                Thermo: [4x3 double]
           Thermodelta: [4x3 double]
    
  2. Перечислите потенциальные димеры для последовательности.

    S2.Dimers
    
    ans =
    
    ACGTagaggacgtn
    ACGTagaggACGTn
    acgtagagGACGTN

Ссылки

[1] Breslauer, K.J., Frank, R., Blöcker, H. and Marky, L.A. (1986). Предсказание ДНК устойчивости дуплекса из основной последовательности. Труды Национальной академии наук США 83, 3746-3750.

[2] Chen, S.H., Lin, C.Y., Cho, C.S., Lo, C.Z., and Hsiung, C.A. (2003). Primer Проекта Assistant (PDA): веб- Design Tool праймера. Исследования нуклеиновых кислот 31 (13), 3751-3754.

[3] Howley, PM, Israel, M.A., Закон, М. и Мартин, М. А. (1979). Быстрый метод обнаружения и отображения гомологии между гетерологичными ДНК. Оценка геномов полиомавирусов. Журнал биологической химии 254 (11), 4876-4883.

[4] Marmur, J. and Doty, P. (1962). Определение базового состава дезоксирибонуклеиновой кислоты от температуры ее тепловой денатурации. Журнал Молекулярная биология 5, 109-118.

[5] Панджкович, А., и Мело, Ф. (2005). Сравнение различных методов вычисления температуры плавления для коротких последовательностей ДНК. Биоинформатика 21 (6), 711-722.

[6] Санта-Люсия-младший, J., Allawi, H.T., and Seneviratne, P.A. (1996). Улучшенные параметры ближайшего соседа для предсказания устойчивости ДНК. Биохимия 35, 3555-3562.

[7] Санта-Люсия-младший, J. (1998). Унифицированное представление полимера, гантели и олигонуклеотидной ДНК ближайшей соседней термодинамики. Материалы Национальной академии наук США 95, 1460-1465.

[8] Sugimoto, N., Nakano, S., Yoneyama, M. and Honda, K. (1996). Улучшенные термодинамические параметры и коэффициент инициации спирали для предсказания устойчивости ДНК дуплекса. Исследования нуклеиновых кислот 24 (22), 4501-4505.

[9] http://www.basic.northwestern.edu/biotools/oligocalc.html для вычисления веса.

Представлено до R2006a