Выполните круговую двоичную сегментацию (CBS) на основе массивов данных сравнительной геномной гибридизации (aCGH)
SegmentStruct
= cghcbs(CGHData
)
SegmentStruct
= cghcbs(CGHData
,
...'Alpha', AlphaValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Permutations', PermutationsValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Method', MethodValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'StoppingRule', StoppingRuleValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Smooth', SmoothValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Prune', PruneValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Errsum', ErrsumValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'WindowSize', WindowSizeValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'SampleIndex', SampleIndexValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Chromosome', ChromosomeValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Showplot', ShowplotValue
, ...)
SegmentStruct
= cghcbs(CGHData
,
...'Verbose', VerboseValue
, ...)
CGHData | Основанные на массивах сравнительные данные геномной гибридизации (aCGH) в любой из следующих форм:
|
AlphaValue | Скаляр, который задает уровень значимости для статистических тестов, чтобы принять точки изменения. По умолчанию это 0.01 . |
PermutationsValue | Скаляр, который задает количество сочетаний, используемых для оценки p-значения. По умолчанию это 10,000 . |
MethodValue | Вектор символов или строка, которая задает метод для оценки p-значений. Варианты 'Perm' или 'Hybrid' (по умолчанию). 'Perm' делает полное сочетание, в то время как 'Hybrid' использует более быструю, основанную на хвостовой вероятности, сочетание. При использовании 'Hybrid' метод, 'Perm' метод применяется автоматически, когда длина данных сегмента становится меньше 200. |
StoppingRuleValue | Управляет использованием эвристического правила остановки, основанного на методе, описанном Венкатраманом и Ольшеном (2007), чтобы объявить изменение, не выполняя полное количество сочетаний для оценки p-значения, всякий раз, когда становится очень вероятно, что изменение было обнаружено. Варианты true или false (по умолчанию).Совет Установите это свойство на |
SmoothValue | Управляет сглаживанием выбросов перед сегментацией, используя процедуру, объясненную Olshen et al. (2004). Варианты true (по умолчанию) или false . |
PruneValue | Управляет устранением точек изменения, идентифицированных из-за локальных трендов в данных, которые не указывают на реальное изменение номера копии, используя процедуру, объясненную Olshen et al. (2004). Варианты true или false (по умолчанию). |
ErrsumValue | Скаляр, который задает допустимое пропорциональное увеличение суммы ошибок квадратов при устранении точек изменения с помощью 'Prune' свойство. Обычно используемые значения 0.05 и 0.1 . По умолчанию это 0.05 . |
WindowSizeValue | Скаляр, который задает размер окна (в точках данных), используемого для деления данных при использовании 'Perm' метод на больших наборах данных. По умолчанию это 200 . |
SampleIndexValue | Один индекс выборки или вектор выборочных индексов, которые задают выборки (выборки ) (ы) для анализа. По умолчанию это все выборочные индексы . |
ChromosomeValue | Одно число хромосом или вектор чисел хромосом, которые определяют данные для анализа. По умолчанию это все числа хромосом. |
ShowplotValue | Управление отображением графиков сегмента означает над исходными данными. Возможны следующие варианты:
По умолчанию это:
|
VerboseValue | Управление отображением отчета о прогрессе анализа. Варианты true (по умолчанию) или false . |
SegmentStruct | Структура, содержащая информацию о сегментации в следующих полях:
|
выполняет круговую двоичную сегментацию (CBS) по данным сравнительной геномной гибридизации (aCGH) на основе массивов для определения сегментов изменения числа копий (соседние области ДНК, которые показывают статистическое различие в количестве копий) и точек изменения. SegmentStruct
= cghcbs(CGHData
)
Примечание
Алгоритм CBS рекурсивно разделяет хромосомы на сегменты на основе максимальной статистики t, оцененной сочетанием. Эти расчеты могут занять много времени. Если n
= количество точек данных, затем время расчета ~ O (n
2).
вызывает SegmentStruct
= cghcbs (CGHData
... 'PropertyName
', PropertyValue
, ...)cghcbs
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
задает уровень значимости для статистических тестов, чтобы принять точки изменения. По умолчанию это SegmentStruct
= cghcbs(CGHData
,
...'Alpha', AlphaValue
, ...)0.01
.
задает количество сочетаний, используемых для оценки p-значения. По умолчанию это SegmentStruct
= cghcbs(CGHData
,
...'Permutations', PermutationsValue
, ...)10,000
.
задает метод для оценки значений p. Варианты SegmentStruct
= cghcbs(CGHData
,
...'Method', MethodValue
, ...)'Perm'
или 'Hybrid'
(по умолчанию). 'Perm'
делает полное сочетание, в то время как 'Hybrid'
использует более быструю, основанную на хвостовой вероятности, сочетание. При использовании 'Hybrid'
метод, 'Perm'
метод применяется автоматически, когда длина данных сегмента становится меньше 200.
управляет использованием эвристического правила остановки, основанного на методе, описанном Венкатраманом и Ольшеном (2007), чтобы объявить изменение, не выполняя полное количество сочетаний для оценки p-значения, всякий раз, когда становится очень вероятно, что изменение было обнаружено. Варианты SegmentStruct
= cghcbs(CGHData
,
...'StoppingRule', StoppingRuleValue
, ...)true
или false
(по умолчанию).
управляет сглаживанием выбросов перед сегментацией, используя процедуру, объясненную Olshen et al. (2004). Варианты SegmentStruct
= cghcbs(CGHData
,
...'Smooth', SmoothValue
, ...)true
(по умолчанию) или false
.
управляет устранением точек изменения, идентифицированных из-за локальных трендов в данных, которые не указывают на реальное изменение номера копии, используя процедуру, объясненную Olshen et al. (2004). Варианты SegmentStruct
= cghcbs(CGHData
,
...'Prune', PruneValue
, ...)true
или false
(по умолчанию).
задает допустимое пропорциональное увеличение суммы ошибок квадратов при исключении точек изменения с помощью SegmentStruct
= cghcbs(CGHData
,
...'Errsum', ErrsumValue
, ...)'Prune'
свойство. Обычно используемые значения 0.05
и 0.1
. По умолчанию это 0.05
.
задает размер окна (в точках данных), используемого для деления данных при использовании SegmentStruct
= cghcbs(CGHData
,
...'WindowSize', WindowSizeValue
, ...)'Perm'
метод на больших наборах данных. По умолчанию это 200
.
анализирует только выборки (выборки ), заданные SegmentStruct
= cghcbs(CGHData
,
...'SampleIndex', SampleIndexValue
, ...)SampleIndexValue
, который может быть одним индексом выборки или вектором индексов выборки. По умолчанию это все выборочные индексы.
анализирует только данные по хромосомам, заданные SegmentStruct
= cghcbs(CGHData
,
...'Chromosome', ChromosomeValue
, ...)ChromosomeValue
, который может быть одним числом хромосом или вектором с числами хромосом. По умолчанию это все числа хромосом.
управляет отображением графиков средств сегмента над исходными данными. Варианты SegmentStruct
= cghcbs(CGHData
,
...'Showplot', ShowplotValue
, ...)true
, false
, W
, S
, или I
целое число, задающее одну из хромосом в CGHData
. Когда ShowplotValue
является true
все хромосомы во всех выборках построены. Если существуют несколько выборок в CGHData
затем каждая выборка строится в отдельном окне рисунка. Когда ShowplotValue
является W
, размещение отображает все хромосомы на одном графике в Окно рисунка. Когда ShowplotValue
является S
, размещение отображает каждую хромосому на подграфике в Окно рисунка. Когда ShowplotValue
является I
, нанесена только указанная хромосома. По умолчанию либо:
false
- Когда заданы возвращаемые значения.
true
и W
- Когда значения возврата не заданы.
управляет отображением отчета о прогрессе выполнения анализа. Варианты SegmentStruct
= cghcbs(CGHData
,
...'Verbose', VerboseValue
, ...)true
(по умолчанию) или false
.
[1] Olshen, A.B., Venkatraman, E.S., Lucito, R., and Wigler, M. (2004). Круговая двоичная сегментация для анализа данных о количестве копий ДНК на основе массивов. Биостатистика 5, 4, 557-572.
[2] Venkatraman, E.S., and Olshen, A.B. (2007). Более быстрый алгоритм круговой двоичной сегментации для анализа данных CGH массива. Биоинформатика 23 (6), 657-663.
[3] Venkatraman, E.S., and Olshen, A.B. (2006). DNAcopy: пакет для анализа данных для копирования ДНК. https://www.bioconductor.org/packages/2.1/bioc/html/DNAcopy.html
[4] Снейдерс, А. М., Новак, Н., Сегрейвз, Р., Блэквуд, С., Браун, Н., Конрой, Дж., Гамильтон, Г., Хиндл, А. К., Хьюи, Б., Кимура, К., Лоу, С., Grey, J.W., Jain, A.N., Pinkel, D., and Albertson, D.G. (2001). Сборка микромассивов для общегеномного измерения количества копий ДНК. Генетика природы 29, 263-264.
[5] Aguirre, A.J., Brennan, C., Bailey, G., Sinha, R., Feng, B., Leo, C., Zhang, Y., Zhang, J., Gans, J.D., Bardeesy, N., Cauwels, C., Cordon-Cardo, C., Redston, M.S., DePinho, R.A., and Chin, L. (2004). Высокая характеристика генома аденокарциномы поджелудочной железы. ПНАС 101, 24, 9067-9072.