В этом примере показано, как учиться, DNA копируют варианты номера путем предварительной обработки и анализа данных из массива Affymetrix® GeneChip® Human Mapping 100k.
Вариант номера копии (CNV) задан как хромосомный сегмент, который составляет 1 КБ или больше в длине, номер копии которой варьируется по сравнению со ссылочным геномом. CNV является одним из признаков генетической нестабильности, характерной для большинства человеческих случаев рака. При изучении раковых образований важная цель состоит в том, чтобы быстро и точно идентифицировать усиления номера копии и удаления, и оценить их частоты в уровень генома. Недавно, массивы одного полиморфизма нуклеотида (SNP) использовались, чтобы обнаружить и определить количество изменений номера копии всего генома с высоким разрешением. Подходы SNP массивов также предоставляют информацию о генотипе. Например, они могут показать потерю гетерозиготности (LOH), которая может представить свидетельства поддержки для присутствия удаления.
Affymetrix GeneChip, Сопоставляющий Набор Массивов, является популярной платформой для высокопроизводительного генотипирования SNP и обнаружения CNV. В этом примере мы используем общедоступный набор данных от массива SNP Affymetrix 100K, который опрашивает более чем 100 000 сайтов SNP. Вы импортируете и предварительно обработаете тестовые данные об уровне, оцените необработанные отношения сигнала выборок по сравнению со ссылками, и затем выведете числа копии в каждом местоположении SNP после сегментации.
Чжао и др. изучил изменения номера копии всего генома человеческих клеточных линий карциномы легкого и первичных опухолей [1]. Выборки были гибридизированы к массивам SNP Affymetrix 100K, каждый содержащий 115 593 сопоставленных мест SNP. В данном примере вы будете анализировать данные из 24 выборок маленькой карциномы легкого ячейки (SCLC), которых 19 были первичные выборки опухоли, и 5 были выборки клеточной линии.
Для каждой выборки SNPs были геновведены с двумя различными массивами, Ранний доступ 50KXba и Ранний доступ 50KHind, параллельно. Короче говоря, два определенных количества выборок DNA были сначала переварены с ферментом ограничения XbaI или HindIII, соответственно. Переваренный DNA был лигирован к адаптеру перед последующим усилением цепной реакции полимеразы (PCR). Четыре реакции PCR были настроены для каждого XbaI или HindIII лигированная адаптером выборка DNA. Продукты PCR от этих четырех реакций были объединены, сконцентрированы и фрагментированы к области значений размера 250 - 2 000 BP. Фрагментированные продукты PCR были затем помечены, денатурированы и гибридизированы к массивам.
В данном примере вы будете работать с данными из EA 50KXba массив. Чтобы анализировать данные из EA 50KHind массив только повторяют шаги. Данные массива SNP хранятся в файлах CEL с каждым файлом CEL, содержащим данные из одного массива.
Примечание: анализ данных SNP Высокой плотности микромассивов требует расширенных объемов памяти от операционной системы; если вы получаете "Out of memory"
ошибки при выполнении этого примера, попытайтесь увеличить виртуальную память (или область подкачки) операционной системы или попытайтесь установить переключатель 3GB (только 32-битный Windows® XP). Эти методы описаны в этом документе.
Этот пример использует 50KXba и 50KHind наборы данных массива SNP (не включенный в тулбокс) из Лаборатории Мейерсона в Онкологическом институте Даны-Фарбера. Можно использовать любой другой набор данных, чтобы выполнить подобные исследования.
Файлами библиотеки CDF, используемыми в этих двух массивах, является CentXbaAv2.cdf
и CentHindAv2.cdf
. Можно получить эти файлы из веб-сайта Affymetrix.
Установите переменную Xba_celPath
с путем к местоположению вы сохранили массив Xba файлы CEL и переменная libPath
с путем к местоположению файла библиотеки CDF для EA 50KXba массив SNP. (Эти файлы не распределяются с Bioinformatics Toolbox™).
Xba_celPath = 'C:\Examples\affysnpcnvdemo\Xba_array'; libPath = 'C:\Examples\affysnpcnvdemo\LibFiles';
SCLC_Sample_CEL.txt
, файл, которому предоставляют программное обеспечение Bioinformatics Toolbox™, содержит список 24 имен файлов CEL, используемых в этом примере и выборках (5 клеточных линий SCLC и 19 первичных опухолей), которому они принадлежат. Загрузите эти данные в две переменные MATLAB®.
fid = fopen('SCLC_Sample_CEL.txt','r'); ftext = textscan(fid, '%q%q'); fclose(fid); samples = ftext{1}; cels = ftext{2}; nSample = numel(samples)
nSample = 24
Affymetrix 50KXba массив SNP имеет плотность до 50K сайтов SNP. Каждый SNP на массиве представлен набором тестовых четырехразрядных байтов. Тестовый четырехразрядный байт состоит из набора тестовых пар для обеих аллелей (A и B) и и для вперед и для противоположные скрутки (антисмысл и смысл) для SNP. Каждая тестовая пара состоит идеальная пара (PM), зонд и несоответствие (MM) зонд. Программное обеспечение Bioinformatics Toolbox обеспечивает функции, чтобы получить доступ к данным тестового уровня.
Функциональный affyread
читает файлы CEL и файлы библиотеки CDF для массивов SNP Affymetrix.
Считайте шестой файл CEL EA 50KXba данные в структуру MATLAB.
s_cel = affyread(fullfile(Xba_celPath, [cels{6} '.CEL']))
s_cel = struct with fields: Name: 'S0168T.CEL' DataPath: 'C:\Examples\affysnpcnvdemo\Xba_array' LibPath: 'C:\Examples\affysnpcnvdemo\Xba_array' FullPathName: 'C:\Examples\affysnpcnvdemo\Xba_array\S0168T.CEL' ChipType: 'CentXbaAv2' Date: '01-Feb-2013 11:54:13' FileVersion: 3 Algorithm: 'Percentile' AlgParams: 'Percentile:75;CellMargin:2;OutlierHigh:1.500;OutlierLow:1.004;AlgVersion:6.0;FixedCellSize:TRUE;FullFeatureWidth:5;FullFeatureHeight:5;IgnoreOutliersInShiftRows:FALSE;FeatureExtraction:TRUE;PoolWidthExtenstion:2;PoolHeightExtension:2;UseSubgrids:FALSE;RandomizePixels:FALSE;ErrorBasis:StdvMean;StdMult:1.000000' NumAlgParams: 16 CellMargin: 2 Rows: 1600 Cols: 1600 NumMasked: 0 NumOutliers: 12478 NumProbes: 2560000 UpperLeftX: 222 UpperLeftY: 236 UpperRightX: 8410 UpperRightY: 219 LowerLeftX: 252 LowerLeftY: 8426 LowerRightX: 8440 LowerRightY: 8410 ProbeColumnNames: {8×1 cell} Probes: [2560000×8 single]
Считайте файл библиотеки CDF для EA 50KXba массив в структуру MATLAB.
s_cdf = affyread(fullfile(libPath, 'CentXbaAv2.cdf'))
s_cdf = struct with fields: Name: 'CentXbaAv2.cdf' ChipType: 'CentXbaAv2' LibPath: 'C:\Examples\affysnpcnvdemo\LibFiles' FullPathName: 'C:\Examples\affysnpcnvdemo\LibFiles\CentXbaAv2.cdf' Date: '01-Feb-2013 11:54:12' Rows: 1600 Cols: 1600 NumProbeSets: 63434 NumQCProbeSets: 9 ProbeSetColumnNames: {6×1 cell} ProbeSets: [63443×1 struct]
Можно смотреть общее качество массива путем просмотра данных об интенсивности тестового уровня с помощью функционального maimage
.
maimage(s_cel)
affysnpquartets
функция составляет таблицу тестовых четырехразрядных байтов для SNP. На массивах SNP Affymetrix 100K тестовый четырехразрядный байт содержит 20 тестовых пар. Например, чтобы получить подробную информацию о тестовом наборе номер 6540, можно ввести следующие команды:
ps_id = 6540; ps_qt = affysnpquartets(s_cel, s_cdf, ps_id)
ps_qt = struct with fields: ProbeSet: '2685329' AlleleA: 'A' AlleleB: 'G' Quartet: [1×6 struct]
Можно также просмотреть карту тепла интенсивности премьер-министра и пар зонда MM четырехразрядного байта зонда SNP с помощью probesetplot
функция. Нажмите кнопку Insert Colorbar, чтобы показать цветовую шкалу карты тепла.
probesetplot(s_cel, s_cdf, ps_id, 'imageonly', true);
В этом представлении 20 тестовых пар упорядочены слева направо. Первые две строки (10 тестовых пар) соответствуют аллели A, и последние две строки (10 тестовых пар) соответствуют аллели B. Для каждой аллели левые 5 тестовых пар соответствуют скрутке смысла (-), в то время как правильные 5 тестовых пар соответствуют антисмыслу (+) скрутка.
Вы будете использовать celintensityread
функционируйте, чтобы считать все 24 файла CEL. celintensityread
функция возвращает структуру, содержащую матрицы PM и MM (дополнительная) интенсивность для зондов и их чисел группы. В каждой тестовой матрице интенсивности индексы столбца соответствуют порядку, в котором были считаны файлы CEL, и каждая строка соответствует зонду. Для анализа номера копии (CN) только необходима интенсивность PM.
Импортируйте тестовые данные об интенсивности всего EA 50KXba массивы в структуру MATLAB.
XbaData = celintensityread(cels, 'CentXbaAv2.cdf',... 'celpath', Xba_celPath, 'cdfpath', libPath)
Reading CDF file: CentXbaAv2.cdf Reading file 1 of 24: H524 Reading file 2 of 24: H526 Reading file 3 of 24: H1184 Reading file 4 of 24: H1607 Reading file 5 of 24: H1963 Reading file 6 of 24: S0168T Reading file 7 of 24: S0169T Reading file 8 of 24: S0170T Reading file 9 of 24: S0171T Reading file 10 of 24: S0172T Reading file 11 of 24: S0173T Reading file 12 of 24: S0177T Reading file 13 of 24: S0185T Reading file 14 of 24: S0187T Reading file 15 of 24: S0188T Reading file 16 of 24: S0189T Reading file 17 of 24: S0190T Reading file 18 of 24: S0191T Reading file 19 of 24: S0192T Reading file 20 of 24: S0193T Reading file 21 of 24: S0194T Reading file 22 of 24: S0196T Reading file 23 of 24: S0198T Reading file 24 of 24: S0199T XbaData = struct with fields: CDFName: 'CentXbaAv2.cdf' CELNames: {1×24 cell} NumChips: 24 NumProbeSets: 63434 NumProbes: 1268480 ProbeSetIDs: {63434×1 cell} ProbeIndices: [1268480×1 uint8] GroupNumbers: [1268480×1 uint8] PMIntensities: [1268480×24 single]
Affymetrix Ранний доступ к массивам совпадают с текущим коммерческим Отображением 100K массивы за исключением некоторых кашировавшие зонды. Данные, полученные из EA Affymetrix 100K массивы SNP, могут быть преобразованы в Отображение 100K массивы путем отфильтровывания отклоненных идентификаторов зонда SNP на Раннем доступе к массиву и преобразования идентификаторов SNP в Отображение 100K идентификаторы SNP. Идентификаторы SNP для EA 50KXba и 50KHind массивы и их соответствующие идентификаторы SNP при Отображении 50KXba и 50KHind массивы обеспечиваются в двух файлах MAT, поставленных с программным обеспечением Bioinformatics Toolbox, Mapping50K_Xba_V_EA
и Mapping50K_Hind_V_EA
, соответственно.
load Mapping50K_Xba_V_EA
Функция помощника affysnpemconvert
преобразует данные в Отображение 50KXba данные.
XbaData = affysnpemconvert(XbaData, EA50K_Xba_SNPID, Mapping50K_Xba_SNPID)
XbaData = struct with fields: CDFName: 'CentXbaAv2.cdf' CELNames: {1×24 cell} NumChips: 24 NumProbeSets: 58960 NumProbes: 1179200 ProbeSetIDs: {58960×1 cell} ProbeIndices: [1179200×1 uint8] GroupNumbers: [1179200×1 uint8] PMIntensities: [1179200×24 single]
Можно просмотреть графики плотности преобразованного в журнал распределения интенсивности PM через эти 24 выборки перед предварительной обработкой.
f=zeros(nSample, 100); xi = zeros(nSample, 100); for i = 1:nSample [f(i,:),xi(i,:)] = ksdensity(log2(XbaData.PMIntensities(:,i))); end
figure; plot(xi', f') xlabel('log2(PM)') ylabel('Density') title('Density Plot') hold on
Нормализация квантиля является особенно эффективной при нормализации нелинейности в данных, введенных экспериментальными смещениями. Выполните нормализацию квантиля с помощью quantilenorm
функция.
XbaData.PMIntensities = quantilenorm(XbaData.PMIntensities);
Постройте получившееся распределение квантиля с помощью пунктирной красной кривой.
[f,xi] = ksdensity(log2(XbaData.PMIntensities(:,1))); plot(xi', f', '--r', 'Linewidth', 3) hold off
Примечание: можно также использовать RMA или процедуры GCRMA для фоновой коррекции. Процедура RMA оценивает фон моделью смеси, где фоновые сигналы приняты, чтобы быть нормально распределенными, и истинные сигналы экспоненциально распределяются, в то время как процесс GCRMA состоит из оптической фоновой коррекции и основанной на тестовой последовательности фоновой корректировки. Для получения дополнительной информации о том, как использовать RMA и процедуры GCRMA, смотрите Предварительную обработку Affymetrix® Microarray Data на Тестовом Уровне.
При помощи GroupNumbers
полевые данные из структуры XbaData
, можно извлечь интенсивность для аллели A и аллели B для каждого зонда. Используйте функциональный affysnpintensitysplit
разделять тестовую матрицу интенсивности PMIntensities
в две матрицы с одинарной точностью, PMAIntensities
и PMBIntensities
, для аллели A и аллели B зондирует соответственно. Количество зондов в каждой матрице является максимальным количеством зондов для каждой аллели.
XbaData = affysnpintensitysplit(XbaData)
XbaData = struct with fields: CDFName: 'CentXbaAv2.cdf' CELNames: {1×24 cell} NumChips: 24 NumProbeSets: 58960 NumProbes: 589600 ProbeSetIDs: {58960×1 cell} ProbeIndices: [589600×1 uint8] PMAIntensities: [589600×24 single] PMBIntensities: [589600×24 single]
Для общего анализа номера копии упрощение должно проигнорировать аллель A и аллель B последовательности и их информация о скрутке и, вместо этого, объединить интенсивность премьер-министра для аллели A и аллели B каждой тестовой пары.
PM_Xba = XbaData.PMAIntensities + XbaData.PMBIntensities;
Для конкретного SNP у нас теперь есть K (K=5 для Affymetrix, Сопоставляющего 100K массивы) добавленные сигналы, каждый сигнал, являющийся мерой того же самого - общий CN. Однако каждый из сигналов K имеет немного отличающиеся последовательности, таким образом, их КПД гибридизации может отличаться. Можно использовать методы резюмирования RMA, чтобы подвести итог интенсивности зонда аллели для каждого набора зонда SNP.
PM_Xba = rmasummary(XbaData.ProbeIndices, PM_Xba);
Affymetrix обеспечивает отформатированные CSV файлы аннотации для их массивов SNP. Можно загрузить файлы аннотации для Отображения 100K массивы от http://www.affymetrix.com/support/technical/annotationfilesmain.affx.
В данном примере загрузите и разархивируйте файл аннотации для Отображения, 50KXba массив Mapping50K_Xba240.na29.annot.csv
. Информация о зонде SNP Отображения 50KXba массив, может быть считан из этого файла аннотации. Установите переменную annoPath
с путем к местоположению, где вы сохранили файл аннотации.
annoPath = 'C:\Examples\affysnpcnvdemo\AnnotFiles';
Функциональный affysnpannotread
читает файл аннотации и возвращает структуру, содержащую информацию о хромосоме SNP, хромосомные положения, последовательности и информацию о длине фрагмента PCR, упорядоченную тестовыми идентификаторами набора от второй входной переменной.
annoFile = fullfile(annoPath, 'Mapping50K_Xba240.na29.annot.csv');
annot_Xba = affysnpannotread(annoFile, XbaData.ProbeSetIDs)
annot_Xba = struct with fields: ProbeSetIDs: {58960×1 cell} Chromosome: [58960×1 int8] ChromPosition: [58960×1 double] Cytoband: {58960×1 cell} Sequence: {58960×1 cell} AlleleA: {58960×1 cell} AlleleB: {58960×1 cell} Accession: {58960×1 cell} FragmentLength: [58960×1 double]
Относительный номер копии в SNP между двумя выборками оценивается на основе log2 отношения нормированных сигналов. Усредненные нормированные сигналы от нормальных выборок используются в качестве глобальной ссылки. Предварительно обработанное ссылочное среднее значение преобразованные в журнал сигналы для Отображения 50KXBa массив и 50KHind массив обеспечивается в MAT-файлах, SCLC_normal_Xba
и SCLC_normal_Hind
соответственно.
load SCLC_Normal_Xba
Оцените log2 отношение нормированных сигналов.
log2Ratio_Xba = bsxfun(@minus, PM_Xba, mean_normal_PM_Xba);
Зонды SNPs с недостающим номером хромосомы, геномным положением или длиной фрагмента в файле аннотации не имеют достаточной информации для далее анализа CN. Также для анализа CN, Y хромосомы обычно игнорируются. Отфильтруйте эти зонды SNP.
fidx = annot_Xba.Chromosome == -1 | annot_Xba.Chromosome == 24 |...
annot_Xba.ChromPosition == -1 | annot_Xba.FragmentLength == 0;
log2Ratio_Xba(fidx, :) = [];
chromosome_Xba = annot_Xba.Chromosome(~fidx);
genomepos_Xba = annot_Xba.ChromPosition(~fidx);
probesetids_Xba = XbaData.ProbeSetIDs(~fidx);
fragmentlen_Xba = annot_Xba.FragmentLength(~fidx);
accession_Xba = annot_Xba.Accession(~fidx);
Закажите оценку CN числами хромосом:
[chr_sort, sidx] = sort(chromosome_Xba); gpos_sort = genomepos_Xba(sidx); log2Ratio_sort = log2Ratio_Xba(sidx, :); probesetids_sort = probesetids_Xba(sidx); fragmentlen_sort = fragmentlen_Xba(sidx); accession_sort = accession_Xba(sidx);
Закажите оценку CN хромосомными геномными положениями:
u_chr = unique(chr_sort); gpsidx = zeros(length(gpos_sort),1); for i = 1:length(u_chr) uidx = find(chr_sort == u_chr(i)); gp_s = gpos_sort(uidx); [gp_ss, ssidx] = sort(gp_s); s_res = uidx(ssidx); gpsidx(uidx) = s_res; end
gpos_ssort = gpos_sort(gpsidx); log2Ratio_ssort = log2Ratio_sort(gpsidx, :); probesetids_ssort = probesetids_sort(gpsidx); fragmentlen_ssort = fragmentlen_sort(gpsidx); accession_ssort = accession_sort(gpsidx);
В анализе должны быть учтены систематические эффекты от процесса PCR. Например, более длинные фрагменты обычно приводят к меньшему количеству усиления PCR, которое приводит к меньшему количеству материала, чтобы гибридизировать и более слабые сигналы. Вы видите это путем графического вывода необработанной ЦНС с воздействием длины фрагмента.
figure; plot(fragmentlen_ssort, log2Ratio_ssort(:, 1), '.') hold on plot([0 2200], [0 0], '-.g') xlim([0 2200]) ylim([-5 5]) xlabel('Fragment Length') ylabel('log2(Ratio)') title('Pre PCR fragment length normalization')
Nannya и др., 2005 ввел устойчивую линейную модель, чтобы оценить и удалить этот эффект. В данном примере используйте malowess
функция для нормализации длины фрагмента PCR для демонстрационного 1. Затем отобразите сглаженную подходящую кривую.
smoothfit = malowess(fragmentlen_ssort,log2Ratio_ssort(:,1)); hold on plot(fragmentlen_ssort, smoothfit, 'r+') hold off
log2Ratio_norm = log2Ratio_ssort(:,1) - smoothfit;
Постройте нормированную необработанную оценку CN длины фрагмента PCR:
figure; plot(fragmentlen_ssort, log2Ratio_norm, '.'); hold on plot([0 2200], [0 0], '-.g') xlim([0 2200]) ylim([-5 5]) xlabel('Fragment Length') ylabel('log2(Ratio)') title('Post PCR fragment length normalization') hold off
Можно нормировать воздействие длины фрагмента PCR для всех выборок с помощью malowess
функция.
Снова, можно повторить предыдущие шаги для 50KHind данные массива.
Загрузите MAT-файл, содержащий предварительно обработанные и нормированные данные CN и из 50KXba массивы и из 50KHind массивы.
load SCLC_CN_Data
Можно теперь построить профиль целого генома общей ЦНС. Например, постройте профиль целого генома для демонстрационного 1 (CL_H524) с помощью функции помощника plotcngenomeprofile
.
plotcngenomeprofile(SCLC_CN.GenomicPosition,SCLC_CN.Log2Ratio(:, 1),...
SCLC_CN.Chromosome, 1:23, SCLC_CN.Sample{1})
Можно также построить каждую хромосому профиль CN в подграфике. Например, постройте каждую хромосому профиль CN для демонстрационных 12 (PT_0177T):
plotcngenomeprofile(SCLC_CN.GenomicPosition,SCLC_CN.Log2Ratio(:, 12),... SCLC_CN.Chromosome, 1:23, SCLC_CN.Sample{12}, 'S')
В Чжао и др., 2 005 исследованиях, высокоуровневое усиление наблюдалось в q12.2-q12.3 области на хромосоме 8 для выборок SCLS. Можно выполнить сегментацию CBS на хромосоме 8 для демонстрационного PT_S0177T.
sampleid = find(strcmpi(samples, 'PT_S0177T')); ps = cghcbs(SCLC_CN, 'sampleind', sampleid, 'chromosome', 8, 'showplot', 8)
Analyzing: PT_S0177T. Current chromosome 8 ps = struct with fields: Sample: 'PT_S0177T' SegmentData: [1×1 struct]
Добавьте идеограмму для хромосомы 8 к графику:
chromosomeplot('hs_cytoBand.txt', 8, 'addtoplot', gca)
Выведите изменения номера копии:
segment_cn = ceil((2.^ps.SegmentData.Mean)*2); cnv = segment_cn(segment_cn ~= 2); startbp = ps.SegmentData.Start(segment_cn ~= 2) endbp = ps.SegmentData.End(segment_cn ~= 2) startMB = startbp/10^6; endMB = endbp/10^6;
startbp = 62089326 62182830 128769526 endbp = 62182830 62729651 129006828
Можно также получить cytoband информацию для CNVs. Функциональный cytobandread
возвращает cytoband информацию в структуре.
ct = cytobandread('hs_cytoBand.txt')
ct = struct with fields: ChromLabels: {862×1 cell} BandStartBPs: [862×1 int32] BandEndBPs: [862×1 int32] BandLabels: {862×1 cell} GieStains: {862×1 cell}
Найдите метки cytoband для CNVs:
cn_cytobands = cell(length(cnv),1); for i = 1:length(cnv) istart = find(ct.BandStartBPs <= startbp(i) & ct.BandEndBPs >= startbp(i) & strcmp(ct.ChromLabels, '8')); iend = find(ct.BandStartBPs <= endbp(i) & ct.BandEndBPs >= endbp(i) & strcmpi(ct.ChromLabels, '8')); if strcmpi(ct.BandLabels{istart}, ct.BandLabels{iend}) cn_cytobands{i} = ['8' ct.BandLabels{istart}]; else cn_cytobands{i} = ['8' ct.BandLabels{istart} '-' '8' ct.BandLabels{iend}]; end end
Создайте отчет, отображающий положения запуска, конечные положения и размер CNVs.
report = sprintf('Cytobands \tStart(Mb)\tEnd(Mb)\t\tSize(Mb)\tCN\n'); for i = 1:length(cnv) report = sprintf('%s%-15s\t%3.2f\t\t%3.2f\t\t%3.2f\t\t%d\n',... report, cn_cytobands{i},startMB(i),endMB(i),endMB(i)-startMB(i),cnv(i)); end disp(report)
Cytobands Start(Mb) End(Mb) Size(Mb) CN 8q12.2 62.09 62.18 0.09 4 8q12.2-8q12.3 62.18 62.73 0.55 7 8q24.21 128.77 129.01 0.24 7
Среди трех областей усиления 8q12-13 область была подтверждена анализом межфазы FISH (Чжао и др., 2005).
Можно также визуализировать часть выборок с усилениями номера копии по крайней мере трех (красных) копий, и скопировать потери номера меньше чем для 1,5 (синих) копий через весь SNPs для всех выборок SCLS. Функциональный cghfreqplot
частота отображений изменений номера копии через несколько выборок. Чтобы лучше визуализировать данные, постройте только SNPs с усилением или частотой потерь более чем 25%.
gainThrd = log2(3/2); lossThrd = log2(1.5/2); cghfreqplot(SCLC_CN, 'Color', [1 0 0; 0 0 1],... 'Threshold', [gainThrd, lossThrd], 'cutoff', 0.25) title('SCLC Summary Plot')
[1] Чжао, X., и др., "Гомозиготные удаления и усиления хромосомы при человеческих карциномах легкого, показанных одним анализом полиморфизма нуклеотида массивов", Исследования рака, 65 (13):5561-70, 2005.
[2] Nannya, Y., и др., "Устойчивый алгоритм для обнаружения номера копии с помощью высокоплотного олигонуклеотида один массивы генотипирования полиморфизма нуклеотида", Исследования рака, 65 (14):6071-8, 2005.