cpgisland

Найдите острова CpG в последовательности ДНК

Синтаксис

cpgStruct = cpgisland(SeqDNA)
cpgStruct = cpgisland(SeqDNA, ...'Window', WindowValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'MinIsland', MinIslandValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'GCmin', GCminValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'CpGoe', CpGoeValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'Plot', PlotValue, ...)

Входные параметры

SeqDNA

Одно из следующего:

  • Вектор символов или строка, задающая последовательность нуклеотида

  • Вектор-строка из целых чисел, задающих последовательность нуклеотида

  • MATLAB® структура, содержащая Sequence поле, которое содержит последовательность нуклеотида ДНК, такой, как возвращено fastaread, fastqread, emblread, getembl, genbankread, или getgenbank

Допустимые символы включают ACG, и T.

cpgisland не считает неоднозначные нуклеотиды или разрывы.

WindowValueЦелое число, задающее размер окна для вычисления содержимого GC и отношений CpGobserved/CpGexpected. Значением по умолчанию является 100 основы. Меньший размер окна увеличивает шум в графике.
MinIslandValueЦелое число, задающее минимальное количество последовательных отмеченных основ, чтобы сообщить как остров CpG. Значением по умолчанию является 200 основы.
GCminValueЗначение, задающее минимальный процент GC в окне, должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.5.
CpGoeValue

Значение, задающее минимальное отношение CpGobserved/CpGexpected в каждом окне, должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.6. Это отношение задано как:

CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs)
PlotValueУправляет графическим выводом содержимого GC, содержимого CpGoe, острова CpG, больше, чем минимальный островной размер и все потенциальные острова CpG для заданных критериев. Выбором является true или false (значение по умолчанию).

Выходные аргументы

cpgStructСтруктура MATLAB, содержащая запуск и конечные основы островов CpG, больше, чем минимальный островной размер.

Описание

cpgStruct = cpgisland(SeqDNA) поисковые запросы SeqDNA, последовательность нуклеотида ДНК, для островов CpG с содержимым GC, больше, чем 50% и отношение CpGobserved/CpGexpected, больше, чем 60%. Это отмечает основы, соответствующие этому критерии в движущемся окне 100 Основы ДНК и затем возвращают результаты в cpgStruct, структура MATLAB, содержащая запуск и конечные основы островов CpG, больше, чем минимальный островной размер 200 основы.

cpgStruct = cpgisland (SeqDNAPropertyName ', PropertyValue, ...) вызовы cpgisland с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

cpgStruct = cpgisland(SeqDNA, ...'Window', WindowValue, ...) задает размер окна для вычисления содержимого GC и отношений CpGobserved/CpGexpected. Значением по умолчанию является 100 основы. Меньший размер окна увеличивает шум в графике.

cpgStruct = cpgisland(SeqDNA, ...'MinIsland', MinIslandValue, ...) задает минимальное количество последовательных отмеченных основ, чтобы сообщить как остров CpG. Значением по умолчанию является 200 основы.

cpgStruct = cpgisland(SeqDNA, ...'GCmin', GCminValue, ...) указывает, что минимальный процент GC в окне должен был отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.5.

cpgStruct = cpgisland(SeqDNA, ...'CpGoe', CpGoeValue, ...) указывает, что минимальное отношение CpGobserved/CpGexpected в каждом окне должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.6. Это отношение задано как:

CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs)

cpgStruct = cpgisland(SeqDNA, ...'Plot', PlotValue, ...) управляет графическим выводом содержимого GC, содержимого CpGoe, острова CpG, больше, чем минимальный островной размер и все потенциальные острова CpG для заданных критериев. Выбором является true или false (значение по умолчанию).

Примеры

  1. Импортируйте последовательность нуклеотида из GenBank® база данных. Например, получите последовательность из хромосомы Человека разумного 12.

    S = getgenbank('AC156455');
  2. Вычислите острова CpG в последовательности и постройте результаты.

    cpgisland(S.Sequence,'PLOT',true)
    
    ans = 
       
        Starts: [4510 29359]
         Stops: [5468 29604]
    

    Острова CpG, больше, чем 200 основ в длине, перечислены, и график отображается.

Смотрите также

| |

Представлено до R2006a