cpgisland

Найдите острова CpG в последовательности DNA

Синтаксис

cpgStruct = cpgisland(SeqDNA)
cpgStruct = cpgisland(SeqDNA, ...'Window', WindowValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'MinIsland', MinIslandValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'GCmin', GCminValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'CpGoe', CpGoeValue, ...)
cpgStruct = cpgisland(SeqDNA, ...'Plot', PlotValue, ...)

Входные параметры

SeqDNA

Одно из следующего:

  • Вектор символов или строка, задающая последовательность нуклеотида

  • Вектор - строка из целых чисел, задающих последовательность нуклеотида

  • Структура MATLAB®, содержащая поле Sequence, которое содержит последовательность нуклеотида DNA, такой, как возвращено fastaread, fastqread, emblread, getembl, genbankread или getgenbank

Допустимые символы включают A, C, G и T.

cpgisland не считает неоднозначные нуклеотиды или разрывы.

WindowValueЦелое число, задающее размер окна для вычисления содержимого GC и отношений CpGobserved/CpGexpected. Значением по умолчанию являются основы 100. Меньший размер окна увеличивает шум в графике.
MinIslandValueЦелое число, задающее минимальное количество последовательных отмеченных основ, чтобы сообщить как остров CpG. Значением по умолчанию являются основы 200.
GCminValueЗначение, задающее минимальный процент GC в окне, должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.5.
CpGoeValue

Значение, задающее минимальное отношение CpGobserved/CpGexpected в каждом окне, должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.6. Это отношение задано как:

CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs)
PlotValueУправляет графическим выводом содержимого GC, содержимого CpGoe, острова CpG, больше, чем минимальный островной размер и все потенциальные острова CpG для заданных критериев. Выбором является true или false (значение по умолчанию).

Выходные аргументы

cpgStructСтруктура MATLAB, содержащая запуск и конечные основы островов CpG, больше, чем минимальный островной размер.

Описание

cpgStruct = cpgisland(SeqDNA) поисковые запросы SeqDNA, последовательность нуклеотида DNA, для островов CpG с содержимым GC, больше, чем % 50 и отношение CpGobserved/CpGexpected, больше, чем % 60. Это отмечает основы, соответствующие этому критерии в движущемся окне основ DNA 100, и затем возвращает результаты в cpgStruct, структура MATLAB, содержащая запуск и конечные основы островов CpG, больше, чем минимальный островной размер основ 200.

cpgStruct = cpgisland(SeqDNA, ...'PropertyName', PropertyValue, ...) вызывает cpgisland с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

cpgStruct = cpgisland(SeqDNA, ...'Window', WindowValue, ...) задает размер окна для вычисления содержимого GC и отношений CpGobserved/CpGexpected. Значением по умолчанию являются основы 100. Меньший размер окна увеличивает шум в графике.

cpgStruct = cpgisland(SeqDNA, ...'MinIsland', MinIslandValue, ...) задает минимальное количество последовательных отмеченных основ, чтобы сообщить как остров CpG. Значением по умолчанию являются основы 200.

cpgStruct = cpgisland(SeqDNA, ...'GCmin', GCminValue, ...) указывает, что минимальный процент GC в окне должен был отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.5.

cpgStruct = cpgisland(SeqDNA, ...'CpGoe', CpGoeValue, ...) указывает, что минимальное отношение CpGobserved/CpGexpected в каждом окне должно было отметить основу. Выбором является значение между 0 и 1. Значением по умолчанию является 0.6. Это отношение задано как:

CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs)

cpgStruct = cpgisland(SeqDNA, ...'Plot', PlotValue, ...) управляет графическим выводом содержимого GC, содержимого CpGoe, острова CpG, больше, чем минимальный островной размер и все потенциальные острова CpG для заданных критериев. Выбором является true или false (значение по умолчанию).

Примеры

  1. Импортируйте последовательность нуклеотида из базы данных GenBank®. Например, получите последовательность из хромосомы Человека разумного 12.

    S = getgenbank('AC156455');
  2. Вычислите острова CpG в последовательности и постройте результаты.

    cpgisland(S.Sequence,'PLOT',true)
    
    ans = 
       
        Starts: [4510 29359]
         Stops: [5468 29604]
    

    Острова CpG, больше, чем 200 основ в длине, перечислены, и график отображается.

Смотрите также

| |

Представлено до R2006a