gcrma

Выполните GC Устойчивое Среднее значение Мультимассивов (GCRMA) фоновая корректировка, нормализация квантиля и резюмирование средней полировки на данных тестового уровня Affymetrix микромассивов

Синтаксис

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM)
ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix)
ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...)
ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...)
ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...)
ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...)
ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...)
ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...)
ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...)
ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

PMMatrix

Матрица значений интенсивности, где каждая строка соответствует идеальной паре (PM), зонд и каждый столбец соответствуют Affymetrix® Файл CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

Совет

Можно использовать PMIntensities матрица, возвращенная celintensityread функция.

MMMatrix

Матрица значений интенсивности, где каждая строка соответствует несоответствию (MM) зонд и каждый столбец, соответствует файлу Affymetrix CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

Совет

Можно использовать MMIntensities матрица, возвращенная celintensityread функция.

ProbeIndices

Вектор-столбец, содержащий тестовые индексы. Зонды в тестовом наборе пронумерованы 0 через N - 1, где N является количеством зондов в тестовом наборе.

Совет

Можно использовать affyprobeseqread функция, чтобы сгенерировать этот вектор-столбец.

AffinPMВектор-столбец PM зондирует сродство.

Совет

Можно использовать affyprobeaffinities функция, чтобы сгенерировать этот вектор-столбец.

AffinMMВектор-столбец MM зондирует сродство.

Совет

Можно использовать affyprobeaffinities функция, чтобы сгенерировать этот вектор-столбец.

SequenceMatrix

N-by-25 матрица информации о последовательности для идеальной пары (PM), зондирует на Affymetrix GeneChip® массив, где N является количеством зондов на массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одному из 25 положений последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 'none'

  • 1 A

  • 2 C

  • 3 G

  • 4 T

Совет

Можно использовать affyprobeseqread функция, чтобы сгенерировать эту матрицу. Если у вас есть эта информация о последовательности в представлении буквы, можно преобразовать его в целочисленное представление с помощью nt2int функция.

ChipIndexValueПоложительное целое число, задающее индекс столбца в MMMatrix, который задает чип. Эти данные об интенсивности чипа используются для расчета тестовое сродство. Значением по умолчанию является 1.
OpticalCorrValueУправляет использованием оптической фоновой коррекции на премьер-министре и значениях интенсивности MM в PMMatrix и MMMatrix. Выбором является true (значение по умолчанию) или false.
CorrConstValueЗначение, которое задает постоянную корреляцию, ро, для фоновой интенсивности для каждой пары зонда PM/MM. Выбором является любое значение ≥ 0 и ≤ 1. Значением по умолчанию является 0.7.
MethodValueВектор символов или строка, которая задает метод, чтобы оценить сигнал. Выбором является 'MLE', более быстрый, оперативный Оценочный метод Наибольшего правдоподобия или 'EB', более медленный, более формальный, эмпирический метод Бейеса. Значением по умолчанию является 'MLE'.
TuningParamValueЗначение, которое задает настраивающийся параметр, используемый оценочным методом. Эта настройка наборы параметров нижняя граница значений сигналов с положительной вероятностью. Выбором является положительное значение. Значением по умолчанию является 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении установки для этого параметра смотрите Ву и др., 2004.

GSBCorrValueЗадает, выполнить ли коррекцию специфичной для гена привязки (GSB) с помощью тестовых данных о сродстве. Выбором является true (значение по умолчанию) или false. Если нет никакой тестовой информации о сродстве, это свойство проигнорировано.
NormalizeValueСредства управления, выполняется ли нормализация квантиля на фоновых скорректированных данных. Выбором является true (значение по умолчанию) или false.
VerboseValue

Управляет отображением отчета о выполнении работ, показывающего количество каждого чипа, когда это завершается. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

ExpressionMatrixМатрица log2 значений выражения, где каждая строка соответствует гену (тестовый набор) и каждый столбец, соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Описание

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM) выполняет фоновую корректировку GCRMA, нормализацию квантиля и резюмирование средней полировки на данных тестового уровня Affymetrix микромассивов с помощью тестовых данных о сродстве. ExpressionMatrix матрица log2 значений выражения, где каждая строка соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Примечание

В ExpressionMatrix нет никакого столбца это содержит тестовый набор или информацию о гене.

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix) выполняет фоновую корректировку GCRMA, нормализацию квантиля и резюмирование Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов с помощью тестовых данных о последовательности, чтобы вычислить тестовые данные о сродстве. ExpressionMatrix матрица log2 значений выражения, где каждая строка соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Примечание

Если AffinPM и AffinMM данные о сродстве и SequenceMatrix данные о последовательности не доступны, можно все еще использовать gcrma функция путем ввода пустой матрицы для этих входных параметров в синтаксисе.

ExpressionMatrix = gcrma (... 'PropertyName', PropertyValue, ...) вызовы gcrma с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...) вычисляет тестовое сродство из данных об интенсивности зонда MM из чипа с заданным индексом столбца в MMMatrix. ChipIndexValue по умолчанию 1. Если AffinPM и AffinMM данные о сродстве обеспечиваются, это свойство проигнорировано.

ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...) управляет использованием оптической фоновой коррекции на премьер-министре и значениях интенсивности MM в PMMatrix и MMMatrix. Выбором является true (значение по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...) задает постоянную корреляцию, ро, для фоновой интенсивности для каждой пары зонда PM/MM. Выбором является любое значение ≥ 0 и ≤ 1. Значением по умолчанию является 0.7.

ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...) задает метод, чтобы оценить сигнал. Выбором является MLE, более быстрый, оперативный Оценочный метод Наибольшего правдоподобия или EB, более медленный, более формальный, эмпирический метод Бейеса. Значением по умолчанию является MLE.

ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...) задает настраивающийся параметр, используемый оценочным методом. Эта настройка наборы параметров нижняя граница значений сигналов с положительной вероятностью. Выбором является положительное значение. Значением по умолчанию является 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении установки для этого параметра смотрите Ву и др., 2004.

ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...) задает, выполнить ли коррекцию гена определенной привязки (GSB) с помощью тестовых данных о сродстве. Выбором является true (значение по умолчанию) или false. Если нет никакой тестовой информации о сродстве, это свойство проигнорировано.

ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...) средства управления, выполняется ли нормализация квантиля на фоновых скорректированных данных. Выбором является true (значение по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...) управляет отображением отчета о выполнении работ, показывающего количество каждого чипа, когда это завершается. Выбором является true (значение по умолчанию) или false.

Примеры

  1. Загрузите MAT-файл, включенный с программным обеспечением Bioinformatics Toolbox™, которое содержит данные Affymetrix из исследования рака простаты. Переменные в MAT-файле включают seqMatrix, матрица, содержащая информацию о последовательности для зондов PM, pmMatrix и mmMatrix, матрицы, содержащие PM и MM, зондируют значения интенсивности и probeIndices, вектор-столбец, содержащий информацию об индексации зонда.

    load prostatecancerrawdata
  2. Вычислите PM Affymetrix и сродство зонда MM от их последовательностей и интенсивности зонда MM.

    [apm, amm] = affyprobeaffinities(seqMatrix, mmMatrix(:,1),...
                 'ProbeIndices', probeIndices);
  3. Выполните фоновую корректировку GCRMA, нормализацию квантиля и резюмирование Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов и создайте матрицу значений выражения.

    expdata = gcrma(pmMatrix, mmMatrix, probeIndices, seqMatrix);

prostatecancerrawdata.mat файл, используемый в этом примере, содержит данные из Лучшего и др., 2005.

Ссылки

[1] Ву, Z., Irizarry, R.A., джентльмен, Р., Мурильо, F.M., и Спенсер, F. (2004). Основанная на модели фоновая корректировка к массивам выражения олигонуклеотида. Журнал американской статистической ассоциации 99 (468), 909–917.

[2] Ву, Z., и Irizarry, R.A. (2005). Стохастические модели, вдохновленные теорией гибридизации для коротких массивов олигонуклеотида. Продолжения RECOMB 2004. J Comput Biol. 12 (6), 882–93.

[3] Ву, Z., и Irizarry, R.A. (2005). Статистическая среда для анализа данных Тестового Уровня микромассивов. Университет Джонса Хопкинса, рабочие документы биостатистики 73.

[4] Скорость, T. (2006). Фоновые модели и GCRMA. Читайте лекции 10, Статистика 246, Калифорнийский университет Беркли.

[5] Лучше всего, C.J.M., Гиллеспи, J.W., И, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Эриксон, H.S., Георгевич, L., Tangrea, M.A., Duray, P.H., Гонсалес, S., Веласко, A., Linehan, W.M., Matusik, R.J., Цена, D.K., Figg, W.D., Emmert-маркер, M.R., и Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке простаты после терапии абляции андрогена. Клинические Исследования рака 11, 6823–6834.

Представленный в R2007a