Определение местоположения островков CpG в последовательности ДНК
cpgStruct
= cpgisland(SeqDNA
)
cpgStruct
= cpgisland(SeqDNA
,
...'Window', WindowValue
, ...)
cpgStruct
= cpgisland(SeqDNA
,
...'MinIsland', MinIslandValue
, ...)
cpgStruct
= cpgisland(SeqDNA
,
...'GCmin', GCminValue
, ...)
cpgStruct
= cpgisland(SeqDNA
,
...'CpGoe', CpGoeValue
, ...)
cpgStruct
= cpgisland(SeqDNA
,
...'Plot', PlotValue
, ...)
SeqDNA | Одно из следующих:
Допустимые символы включают
|
WindowValue | Целое число, задающее размер окна для вычисления содержимого GC и коэффициентов CpGobserved/CpGexpected. По умолчанию это 100 основы. Меньший размер окна увеличивает шум на графике. |
MinIslandValue | Целое число, указывающее минимальное количество последовательных отмеченных основ для сообщения как острова CpG. По умолчанию это 200 основы. |
GCminValue | Значение, определяющее минимальный процент GC в окне, необходимом для маркировки основы. Варианты являются значением между 0 и 1 . По умолчанию это 0.5 . |
CpGoeValue | Значение, определяющее минимальное соотношение CpGobserved/CpGexpected в каждом окне, необходимое для маркировки основы. Варианты являются значением между CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs) |
PlotValue | Управляет графическим изображением содержимого GC, содержимого CpGoe, островов CpG, превышающих минимальный размер острова, и всех потенциальных островов CpG для заданных критериев. Варианты true или false (по умолчанию). |
cpgStruct | Структура MATLAB, содержащая начальные и конечные основы островов CpG, больше минимального размера острова. |
выполняет поиск cpgStruct
= cpgisland(SeqDNA
)SeqDNA
, нуклеотидная последовательность ДНК для островов CpG с содержимым GC более 50
% и отношение CpGobserved/CpGexpected, больше 60
%. Он помечает основы, удовлетворяющие этому критерию, в движущемся окне 100
ДНК основ, а затем возвращает результаты в cpgStruct
, структуру MATLAB, содержащую начальные и конечные основы островов CpG, больше минимального размера острова 200
основы.
вызывает cpgStruct
= cpgisland (SeqDNA
... 'PropertyName
', PropertyValue
, ...)cpgisland
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
задает размер окна для вычисления содержимого GC и коэффициентов CpGobserved/CpGexpected. По умолчанию это cpgStruct
= cpgisland(SeqDNA
,
...'Window', WindowValue
, ...)100
основы. Меньший размер окна увеличивает шум на графике.
задает минимальное количество последовательных отмеченных основ для сообщения в виде острова CpG. По умолчанию это cpgStruct
= cpgisland(SeqDNA
,
...'MinIsland', MinIslandValue
, ...)200
основы.
задает минимальный процент GC в окне, необходимом для маркировки основы. Варианты являются значением между cpgStruct
= cpgisland(SeqDNA
,
...'GCmin', GCminValue
, ...)0
и 1
. По умолчанию это 0.5
.
задает минимальное соотношение CpGobserved/CpGexpected в каждом окне, необходимое для маркировки основы. Варианты являются значением между cpgStruct
= cpgisland(SeqDNA
,
...'CpGoe', CpGoeValue
, ...)0
и 1
. По умолчанию это 0.6
. Это отношение определяется как:
CPGobs/CpGexp = (NumCpGs*Length)/(NumGs*NumCs)
управляет графическим изображением содержимого GC, содержимого CpGoe, островов CpG, превышающих минимальный размер острова, и всех потенциальных островов CpG для заданных критериев. Варианты cpgStruct
= cpgisland(SeqDNA
,
...'Plot', PlotValue
, ...)true
или false
(по умолчанию).
Импорт нуклеотидной последовательности из GenBank® база данных. Например, извлеките последовательность из хромосомы Homo sapiens 12.
S = getgenbank('AC156455');
Вычислите островки CpG в последовательности и постройте график результатов.
cpgisland(S.Sequence,'PLOT',true) ans = Starts: [4510 29359] Stops: [5468 29604]
Перечислены острова CpG, длина которых превышает 200 основы, и отображается график.