Выполнение процедуры GC Brustable Multi-array Average (GCRMA) для данных уровня зонда микрочипа Affymetrix
Expression = affygcrma(CELFiles, CDFFile, SeqFile)
Expression = affygcrma(ProbeStructure, Seq)
Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'CELPath', CELPathValue, ...)
Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'CDFPath', CDFPathValue, ...)
Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'SeqPath', SeqPathValue, ...)
Expression = affygcrma(..., 'ChipIndex', ChipIndexValue, ...)
Expression = affygcrma(..., 'OpticalCorr', OpticalCorrValue, ...)
Expression = affygcrma(..., 'CorrConst', CorrConstValue, ...)
Expression = affygcrma(..., 'Method', MethodValue, ...)
Expression = affygcrma(..., 'TuningParam', TuningParamValue, ...)
Expression = affygcrma(..., 'GSBCorr', GSBCorrValue, ...)
Expression = affygcrma(..., 'Median', MedianValue, ...)
Expression = affygcrma(..., 'Output', OutputValue, ...)
Expression = affygcrma(..., 'Showplot', ShowplotValue, ...)
Expression = affygcrma(..., 'Verbose', VerboseValue, ...)
CELFiles | Любое из следующих действий:
|
CDFFile | Одно из следующих действий:
|
SeqFile | Одно из следующих действий:
|
Seq | Матрица N-by-25 информации о последовательности, например, возвращенная |
ProbeStructure | Структура MATLAB, содержащая информацию из файлов CEL, включая интенсивности зондов, индексы зондов и идентификаторы наборов зондов, возвращаемые |
CELPathValue | Символьный вектор или строка, указывающая путь и папку, в которых указаны файлы |
CDFPathValue | Символьный вектор или строка, указывающая путь и папку, в которой указан файл |
SeqPathValue | Символьный вектор или строка, указывающая папку или путь и папку, где |
ChipIndexValue | Положительное целое число, определяющее чип. Информация о последовательности этого чипа и данные об интенсивности зонда рассогласования используются для вычисления аффинностей зонда. По умолчанию: |
OpticalCorrValue | Управляет использованием оптической коррекции фона на входных значениях интенсивности зонда. Варианты: |
CorrConstValue | Значение, определяющее корреляционную константу rho для логарифмической фоновой интенсивности для каждой пары зондов PM/MM. Варианты - это любое значение |
MethodValue | Символьный вектор или строка, определяющая метод оценки сигнала. Варианты: |
TuningParamValue | Значение, указывающее параметр настройки, используемый методом оценки. Этот параметр настройки устанавливает нижнюю границу значений сигнала с положительной вероятностью. Выбор - это положительное значение. По умолчанию: Совет Информацию об определении параметров для этого параметра см. в Wu et al., 2004. |
GSBCorrValue | Указывает, следует ли выполнять коррекцию геноспецифического связывания (GSB) с использованием данных о сродстве зондов. Варианты: |
MedianValue | Задает использование медианы ранжированных значений вместо среднего значения для нормализации. Варианты: |
OutputValue | Указывает масштаб возвращаемых значений экспрессии генов. Возможны следующие варианты:
В последнем случае данные преобразуются, как определено функцией. |
ShowplotValue | Управляет отображением графика, показывающего log2 значений интенсивности зонда несовпадения (MM) из указанного чипа (CEL-файл), по сравнению с афинностями зонда MM этого чипа. На графике также показана подгонка LOWESS для вычисления данных NSB указанного чипа. Варианты:
|
VerboseValue | Управляет отображением состояния чтения файлов и обработки GCRMA. Варианты: |
Expression | Объект DataMatrix, содержащий значения экспрессии гена log2, которые были скорректированы в фоновом режиме, нормализованы и суммированы с использованием процедуры GC Frability Multi-array Average (GCRMA). Каждая строка в |
считывает указанные файлы Affymetrix CEL, связанный файл библиотеки CDF (созданный из массивов Affymetrix GeneChip для анализа экспрессии или генотипирования) и связанный файл или матрицу последовательности. Затем он обрабатывает значения интенсивности зонда с помощью процедур корректировки фона GCRMA, нормализации квантилей и суммирования медианы, а затем возвращает Expression = affygcrma(CELFiles, CDFFile, SeqFile)Expressionобъект DataMatrix, содержащий значения экспрессии гена на основе log2 в матрице, идентификаторы наборов зондов в качестве имен строк и имена файлов CEL в качестве имен столбцов. Обратите внимание, что каждая строка в Expression соответствует гену (набору зондов), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL генерируется из отдельной микросхемы. Все микросхемы должны быть одного типа.)
CELFiles - символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, содержащих имена CEL-файлов. CDFFile - символьный вектор или строка, задающая имя файла CDF. Если установить CELFiles кому '*'затем считывает все файлы CEL в текущей папке. Если установить CELFiles или CDFFile кому ' 'затем открывается диалоговое окно «Выбор файлов», в котором можно выбрать файлы CEL или CDF. В этом диалоговом окне можно нажать и удерживать клавишу CTRL или SHIFT, чтобы выбрать несколько файлов CEL. SeqFile - файл или матрица, содержащая информацию о последовательности для зондов в определенном типе массива Affymetrix GeneChip.
Примечание
Подробные сведения о чтении файлов и обработке GCRMA см. в разделе celintensityread, affyprobeseqread, affyprobeaffinities, gcrma, gcrmabackadj, quantilenorm, и rmasummary.
использует процедуры корректировки фона GCRMA, нормализации квантилей и суммирования медианы для обработки значений интенсивности зонда в Expression = affygcrma(ProbeStructure, Seq)ProbeStructure. ProbeStructure - структура MATLAB, содержащая информацию из файлов CEL, включая интенсивности зондов, индексы зондов и идентификаторы наборов зондов, возвращаемые celintensityread функция. Seq - матрица, содержащая информацию о последовательности для зондов на определенном типе массива Affymetrix GeneChip.
требования Expression = affygcrma(..., 'PropertyName', PropertyValue, ...)affygcrma с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
указывает путь и папку, в которых файлы указаны Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'CELPath', CELPathValue, ...)CELFiles хранятся.
указывает путь и папку, в которой файл указан Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'CDFPath', CDFPathValue, ...)CDFFile хранится.
указывает путь и папку, в которой файл указан Expression = affygcrma(CELFiles, CDFFile, SeqFile, ...'SeqPath', SeqPathValue, ...)SeqFile хранится.
вычисляет аффинности зонда из данных интенсивности зонда ММ, используя информацию о последовательности и несовпадении значений интенсивности зонда из микросхемы, указанной Expression = affygcrma(..., 'ChipIndex', ChipIndexValue, ...)ChipIndexValue. Дефолт ChipIndexValue является 1.
управляет использованием оптической коррекции фона на входных значениях интенсивности зонда. Варианты: Expression = affygcrma(..., 'OpticalCorr', OpticalCorrValue, ...)true (по умолчанию) или false.
определяет константу корреляции rho для фоновой интенсивности для каждой пары зондов PM/MM. Варианты - это любое значение Expression = affygcrma(..., 'CorrConst', CorrConstValue, ...)≥ 0 и ≤ 1. По умолчанию: 0.7.
определяет метод оценки сигнала. Варианты: Expression = affygcrma(..., 'Method', MethodValue, ...)'MLE', более быстрый, специальный метод оценки максимального правдоподобия или 'EB', более медленный, более формальный, эмпирический метод Байеса. По умолчанию: 'MLE'.
задает параметр настройки, используемый методом оценки. Этот параметр настройки устанавливает нижнюю границу значений сигнала с положительной вероятностью. Выбор - это положительное значение. По умолчанию: Expression = affygcrma(..., 'TuningParam', TuningParamValue, ...)5 (MLE) или 0.5 (EB).
Совет
Информацию об определении параметров для этого параметра см. в Wu et al., 2004.
указывает, следует ли выполнять коррекцию генно-специфического связывания (GSB) с использованием данных о сродстве зондов. Варианты: Expression = affygcrma(..., 'GSBCorr', GSBCorrValue, ...)true (по умолчанию) или false. Если информация о сходстве зонда отсутствует, это свойство игнорируется.
задает использование медианы ранжированных значений вместо среднего значения для нормализации. Варианты: Expression = affygcrma(..., 'Median', MedianValue, ...)true или false (по умолчанию).
задает масштаб возвращаемых значений экспрессии генов. Expression = affygcrma(..., 'Output', OutputValue, ...)OutputValue могут быть:
'log'
'log2'
'log10'
'linear'
@functionname
В последнем случае данные преобразуются, как определено функцией. functionname. По умолчанию: 'log2'.
управляет отображением графика, показывающего log2 значений интенсивности зонда несовпадения (MM) из указанного чипа (CEL-файл), по сравнению со сродствами зонда MM этого чипа. На графике также показана подгонка LOWESS для вычисления данных NSB указанного чипа. Варианты: Expression = affygcrma(..., 'Showplot', ShowplotValue, ...)true, false, или I, целое число, определяющее чип. Если установлено значение true, первая микросхема нанесена на график. Значение по умолчанию:
false - Когда указаны возвращаемые значения.
true - Когда возвращаемые значения не указаны.
управляет отображением состояния чтения файлов и обработки GCRMA. Варианты: Expression = affygcrma(..., 'Verbose', VerboseValue, ...)true (по умолчанию) или false.
В следующем примере предполагается наличие HG_U95Av2.CDF файл библиотеки, хранящийся в D:\Affymetrix\LibFiles\HGGenomeи что текущая папка указывает на расположение, содержащее файлы CEL и файл последовательности, связанный с этим файлом библиотеки CDF. В этом примере affygcrma функция считывает все файлы CEL и файл последовательности в текущей папке и файл CDF в указанной папке. Он также выполняет процедуры корректировки фона GCRMA, нормализации квантования и суммирования значений интенсивности зонда PM и возвращает объект DataMatrix, содержащий метаданные и обработанные данные.
Expression = affygcrma('*', 'HG_U95Av2.CDF','HG-U95Av2_probe_tab',...
'CDFPath', 'D:\Affymetrix\LibFiles\HGGenome');
[1] Наеф, Ф. и Магнаско, М.О. (2003). Решение загадки ярких несоответствий: мечение и эффективное связывание в олигонуклеотидных массивах. Физический обзор E 68, 011906.
[2] Ву, З., Иризарри, Р.А., Джентльмен, Р., Мурильо, Ф.М., и Спенсер, Ф. (2004). Основанная на модели корректировка фона для массивов олигонуклеотидной экспрессии. Журнал Американской статистической ассоциации 99 (468), 909-917.
[3] Ву, З. и Иризарри, Р.А. (2005). Стохастические модели, вдохновленные теорией гибридизации для коротких олигонуклеотидных массивов. Работа РЕКОМБ в 2004 году. J Comput Biol. 12 (6), 882-93.
[4] Ву, З. и Иризарри, Р.А. (2005). Статистическая основа для анализа данных на уровне зондов микрочипов. Университет Джона Хопкинса, рабочие документы по биостатистике 73.
[5] Ву, З. и Иризарри, Р.А. (2003). Основанная на модели корректировка фона для массивов олигонуклеотидной экспрессии. Семинар RSS по экспрессии генов, Уай, Англия, http://biosun01.biostat.jhsph.edu/%7Eririzarr/Talks/gctalk.pdf.
[6] Скорость, Т. (2006). Фоновые модели и GCRMA. Лекция 10, статистика 246, Калифорнийский университет в Беркли.
[7] Абд Раббо, Н. А., и Баракат, Х. М. (1979). Проблемы оценки в двумерном логнормальном распределении. Индиец Дж. Pure Appl. Math 10 (7), 815-825.
[8] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собирается, Я., Эриксон, Х. С., Георгевич, Л., Тангреа, М. А., Дюрей, П.Х., Гонсалес, С., Веласко, А., Линехан, В.М., Матусик, Р.Дж., Прайс, Д.К., Фигг, В.Д., Эммерт-Бак, М.Р., и Чуакки, Р.Ф. (2005). Молекулярные изменения при первичном раке предстательной железы после терапии андрогенной абляцией. Клинические исследования рака 11, 6823-6834.
[9] Иризарри, Р.А., Хоббс, Б., Коллин, Ф., Бизер-Барклай, Ю.Д., Антонеллис, К.Ж., Шерф, У., Скорость, Т.П. (2003). Исследование, нормализация и резюме данных уровня зонда олигонуклеотидного массива высокой плотности. Биостатистика. 4, 249–264.
[10] Мостеллер, Ф. и Туки, Дж. (1977). Анализ и регрессия данных (Reading, Massachusetts: Addison-Wesley Publishing Company), стр. 165-202.
affyprobeaffinities | affyprobeseqread | affyrma | celintensityread | gcrma | gcrmabackadj | mafdr | mattest | quantilenorm | rmasummary