gcrma

Выполните настройку фона GC Robust Мультимассива Среднего значения (GCRMA), нормализацию квантиля и медианное суммирование по данным Affymetrix микромассива уровня зонда

Синтаксис

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM)
ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix)
ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...)
ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...)
ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...)
ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...)
ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...)
ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...)
ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...)
ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

PMMatrix

Матрица значений интенсивности, где каждая строка соответствует зонду совершенного соответствия (PM), и каждый столбец соответствует Affymetrix® Файл CEL. (Каждый файл CEL генерируется из отдельного чипа. Все чипы должны быть одного типа.)

Совет

Можно использовать PMIntensities матрица, возвращенная celintensityread функция.

MMMatrix

Матрица значений интенсивности, где каждая строка соответствует зонду несоответствия (MM), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL генерируется из отдельного чипа. Все чипы должны быть одного типа.)

Совет

Можно использовать MMIntensities матрица, возвращенная celintensityread функция.

ProbeIndices

Вектор-столбец, содержащая индексы зонда. Зонды в наборе зондов пронумерованы с 0 по N-1, где N - количество зондов в наборе зондов.

Совет

Вы можете использовать affyprobeseqread функция, чтобы сгенерировать этот вектор-столбец.

AffinPMВектор-столбец сродства зонда ТЧ.

Совет

Вы можете использовать affyprobeaffinities функция, чтобы сгенерировать этот вектор-столбец.

AffinMMВектор-столбец сродства зонда ММ.

Совет

Вы можете использовать affyprobeaffinities функция, чтобы сгенерировать этот вектор-столбец.

SequenceMatrix

Матрица N -by-25 информации о последовательности для зондов идеального соответствия (PM) на Affymetrix GeneChip® array, где N - количество зондов в массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одной из 25 позиций последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 Ничего

  • 1 - A

  • 2 - C

  • 3 - G

  • 4 - Т

Совет

Вы можете использовать affyprobeseqread функция для генерации этой матрицы. Если у вас есть эта информация о последовательности в буквенном представлении, можно преобразовать ее в целочисленное представление с помощью nt2int функция.

ChipIndexValueПоложительное целое число, задающее индекс столбца в MMMatrix, который задает чип. Эти данные интенсивности чипа используются для вычисления сходства зондов. По умолчанию это 1.
OpticalCorrValueУправляет использованием оптической коррекции фона для значений интенсивности PM и MM в PMMatrix и MMMatrix. Варианты true (по умолчанию) или false.
CorrConstValueЗначение, которое задает константу корреляции, rho, для интенсивности фона для каждой пары зондов PM/MM. Варианты являются любым значением ≥ 0 и ≤ 1. По умолчанию это 0.7.
MethodValueВектор символов или строка, которая задает метод для оценки сигнала. Варианты 'MLE', более быстрый, специальный метод оценки максимальных вероятностей или 'EB', более медленный, формальный, эмпирический метод Байеса. По умолчанию это 'MLE'.
TuningParamValueЗначение, которое задает параметр настройки, используемый методом оценки. Эта настройка наборов параметров нижнюю границу значений сигналов с положительной вероятностью. Выбор является положительным значением. По умолчанию это 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении настройки для этого параметра см. Wu et al., 2004.

GSBCorrValueОпределяет, выполнять ли коррекцию геноспецифического связывания (GSB) с помощью данных о сродстве зондов. Варианты true (по умолчанию) или false. Если нет информации о сродстве зонда, это свойство игнорируется.
NormalizeValueОпределяет, выполняется ли нормализация квантиля на скорректированных по фону данных. Варианты true (по умолчанию) или false.
VerboseValue

Управляет отображением отчета о прогрессе, показывающего количество каждого чипа по мере его завершения. Варианты true (по умолчанию) или false.

Выходные аргументы

ExpressionMatrixМатрица значений экспрессии log2, где каждая строка соответствует гену (набору зондов), и каждый столбец соответствует файлу Affymetrix CEL, который представляет один чип.

Описание

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM) выполняет настройку фона GCRMA, нормализацию квантиля и срединно-польское суммирование по данным уровня зонда микромассивов Affymetrix с помощью данных о сродстве зондов. ExpressionMatrix является матрицей значений экспрессии log2, где каждая строка соответствует гену (набору зондов) и каждый столбец соответствует файлу Affymetrix CEL, который представляет один чип.

Примечание

Нет столбца в ExpressionMatrix который содержит набор зондов или информацию о генах.

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix) выполняет настройку фона GCRMA, нормализацию квантиля и суммирование Robust Multi-array Average (RMA) по данным уровня зонда микромассивов Affymetrix с помощью данных последовательности зондов для вычисления данных сродства зондов. ExpressionMatrix является матрицей значений экспрессии log2, где каждая строка соответствует гену (набору зондов) и каждый столбец соответствует файлу Affymetrix CEL, который представляет один чип.

Примечание

Если AffinPM и AffinMMданные и SequenceMatrix сродства данные последовательности недоступны, вы все еще можете использовать gcrma функция путем ввода пустой матрицы для этих входов в синтаксисе.

ExpressionMatrix = gcrma (... 'PropertyName', PropertyValue, ...) вызывает gcrma с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...) вычисляет сходство зонда из данных интенсивности зонда MM от чипа с заданным индексом столбца в MMMatrix. Значения по умолчанию ChipIndexValue является 1. Если AffinPM и AffinMM предоставляются данные сродства, это свойство игнорируется.

ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...) управляет использованием оптической коррекции фона на значениях интенсивности PM и MM в PMMatrix и MMMatrix. Варианты true (по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...) задает константу корреляции rho для интенсивности фона для каждой пары зондов PM/MM. Варианты являются любым значением ≥ 0 и ≤ 1. По умолчанию это 0.7.

ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...) задает метод оценки сигнала. Варианты MLE, более быстрый, специальный метод оценки максимальных вероятностей или EB, более медленный, формальный, эмпирический метод Байеса. По умолчанию это MLE.

ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...) задает параметр настройки, используемый методом оценки. Эта настройка наборов параметров нижнюю границу значений сигналов с положительной вероятностью. Выбор является положительным значением. По умолчанию это 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении настройки для этого параметра см. Wu et al., 2004.

ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...) определяет, выполнять ли коррекцию генно-специфического связывания (GSB) с помощью данных о сродстве зонда. Варианты true (по умолчанию) или false. Если нет информации о сродстве зонда, это свойство игнорируется.

ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...) управляет, выполняется ли нормализация квантиля на скорректированных по фону данных. Варианты true (по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...) управляет отображением отчета о прогрессе, показывающего количество каждого чипа по мере его завершения. Варианты true (по умолчанию) или false.

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, которое содержит данные Affymetrix из исследования рака предстательной железы. Переменные в MAT-файле включают seqMatrix, матрица, содержащая информацию о последовательности для PM-зондов, pmMatrix и mmMatrixматрицы, содержащие значения интенсивности зонда PM и MM, и probeIndicesВектор-столбец, содержащая информацию индексации зонда.

    load prostatecancerrawdata
  2. Вычислите сходство зондов Affymetrix PM и MM из их последовательностей и интенсивности зондов MM.

    [apm, amm] = affyprobeaffinities(seqMatrix, mmMatrix(:,1),...
                 'ProbeIndices', probeIndices);
  3. Выполните настройку фона GCRMA, нормализацию квантиля и суммирование Robust Multi-array Average (RMA) на данных уровня зонда микромассива Affymetrix и создайте матрицу значений экспрессии.

    expdata = gcrma(pmMatrix, mmMatrix, probeIndices, seqMatrix);

The prostatecancerrawdata.mat файл, используемый в этом примере, содержит данные Best et al., 2005.

Ссылки

[1] Wu, Z., Irizarry, R.A., Gentleman, R., Murillo, F.M., and Spencer, F. (2004). Модельная корректировка фона для массивов экспрессии олигонуклеотидов. Журнал Американской статистической ассоциации 99 (468), 909-917.

[2] Wu, Z., and Irizarry, R.A. (2005). Стохастические модели, вдохновленные теорией гибридизации для коротких олигонуклеотидных массивов. Материалы RECOMB 2004. J Comput Biol. 12 (6), 882-93.

[3] Wu, Z., and Irizarry, R.A. (2005). Статистическая среда для анализа данных уровня зонда микромассивов. Университет Джона Хопкинса, рабочие документы по биостатистике 73.

[4] Скорость, Т. (2006). Фоновые модели и GCRMA. Лекция 10, Статистика 246, Калифорнийский университет в Беркли.

[5] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собери, Я., Эриксон, Х.С., Георгиевич, Л., Тангрея, М.А., Duray, P.H., Gonsalez, S., Velasco, A., Linehan, W.M., Matusik, R.J., Price, D.K., Figg, W.D., Emmert-Buck, M.R., and Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке предстательной железы после андрогенной абляции. Клинические исследования рака 11, 6823-6834.

Введенный в R2007a