gcrma

Выполните GC Устойчивое Среднее значение Мультимассивов (GCRMA) фоновая корректировка, нормализация квантиля и резюмирование средней полировки на данных тестового уровня Affymetrix микромассивов

Синтаксис

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM)
ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix)
ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...)
ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...)
ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...)
ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...)
ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...)
ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...)
ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...)
ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

PMMatrix

Матрица значений интенсивности, где каждая строка соответствует идеальной паре (PM), зонд и каждый столбец соответствуют файлу Affymetrix® CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

Совет

Можно использовать матрицу PMIntensities, возвращенную функцией celintensityread.

MMMatrix

Матрица значений интенсивности, где каждая строка соответствует несоответствию (MM) зонд и каждый столбец, соответствует файлу Affymetrix CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

Совет

Можно использовать матрицу MMIntensities, возвращенную функцией celintensityread.

ProbeIndices

Вектор-столбец, содержащий тестовые индексы. Зонды в тестовом наборе пронумерованы 0 через N - 1, где N является количеством зондов в тестовом наборе.

Совет

Можно использовать функцию affyprobeseqread, чтобы сгенерировать этот вектор-столбец.

AffinPMВектор-столбец PM зондирует сродство.

Совет

Можно использовать функцию affyprobeaffinities, чтобы сгенерировать этот вектор-столбец.

AffinMMВектор-столбец MM зондирует сродство.

Совет

Можно использовать функцию affyprobeaffinities, чтобы сгенерировать этот вектор-столбец.

SequenceMatrix

N-by-25 матрица информации о последовательности для идеальной пары (PM), зондирует на массиве Affymetrix GeneChip®, где N является количеством зондов на массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одному из 25 положений последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 — 'none'

  • 1 — A

  • 2 — C

  • 3 — G

  • 4 — T

Совет

Можно использовать функцию affyprobeseqread, чтобы сгенерировать эту матрицу. Если у вас есть эта информация о последовательности в представлении буквы, можно преобразовать его в целочисленное представление с помощью функции nt2int.

ChipIndexValueПоложительное целое число, задающее индекс столбца в MMMatrix, который задает чип. Эти данные об интенсивности чипа используются, чтобы вычислить тестовое сродство. Значением по умолчанию является 1.
OpticalCorrValueУправляет использованием оптического фонового исправления на премьер-министре и значениях интенсивности MM в PMMatrix и MMMatrix. Выбором является true (значение по умолчанию) или false.
CorrConstValueЗначение, которое задает постоянную корреляцию, ро, для фоновой интенсивности для каждой пары зонда PM/MM. Выбором является любое значение ≥ 0 и ≤ 1. Значением по умолчанию является 0.7.
MethodValueВектор символов или строка, которая задает метод, чтобы оценить сигнал. Выбором является 'MLE', более быстрый, оперативный Оценочный метод Наибольшего правдоподобия, или 'EB', более медленный, более формальный, эмпирический метод Бейеса. Значением по умолчанию является 'MLE'.
TuningParamValueЗначение, которое задает настраивающийся параметр, используемый оценочным методом. Этот настраивающий параметр устанавливает нижнюю границу значений сигналов с положительной вероятностью. Выбором является положительное значение. Значением по умолчанию является 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении установки для этого параметра смотрите Ву и др., 2004.

GSBCorrValueЗадает, выполнить ли исправление специфичной для гена привязки (GSB) с помощью тестовых данных о сродстве. Выбором является true (значение по умолчанию) или false. Если нет никакой тестовой информации о сродстве, это свойство проигнорировано.
NormalizeValueСредства управления, выполняется ли нормализация квантиля на фоновых скорректированных данных. Выбором является true (значение по умолчанию) или false.
VerboseValue

Управляет отображением отчета о выполнении работ, показывающего количество каждого чипа, когда это завершается. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

ExpressionMatrixМатрица log2 значений выражения, где каждая строка соответствует гену (тестовый набор) и каждый столбец, соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Описание

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, AffinPM, AffinMM) выполняет фоновую корректировку GCRMA, нормализацию квантиля и резюмирование средней полировки на данных тестового уровня Affymetrix микромассивов с помощью тестовых данных о сродстве. ExpressionMatrix является матрицей log2 значений выражения, где каждая строка соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Примечание

Нет никакого столбца в ExpressionMatrix, который содержит тестовый набор или информацию о гене.

ExpressionMatrix = gcrma(PMMatrix, MMMatrix, ProbeIndices, SequenceMatrix) выполняет фоновую корректировку GCRMA, нормализацию квантиля и резюмирование Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов с помощью тестовых данных о последовательности, чтобы вычислить тестовые данные о сродстве. ExpressionMatrix является матрицей log2 значений выражения, где каждая строка соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL, который представляет однокристальную схему.

Примечание

Если AffinPM и данные о сродстве AffinMM и данные о последовательности SequenceMatrix не доступны, можно все еще использовать функцию gcrma путем ввода пустой матрицы для этих входных параметров в синтаксисе.

ExpressionMatrix = gcrma( ...'PropertyName', PropertyValue, ...) вызывает gcrma с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

ExpressionMatrix = gcrma(..., 'ChipIndex', ChipIndexValue, ...) вычисляет тестовое сродство из данных об интенсивности зонда MM из чипа с заданным индексом столбца в MMMatrix. ChipIndexValue по умолчанию является 1. Если AffinPM и данные о сродстве AffinMM обеспечиваются, это свойство проигнорировано.

ExpressionMatrix = gcrma(..., 'OpticalCorr', OpticalCorrValue, ...) управляет использованием оптического фонового исправления на премьер-министре и значениях интенсивности MM в PMMatrix и MMMatrix. Выбором является true (значение по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'CorrConst', CorrConstValue, ...) задает постоянную корреляцию, ро, для фоновой интенсивности для каждой пары зонда PM/MM. Выбором является любое значение ≥ 0 и ≤ 1. Значением по умолчанию является 0.7.

ExpressionMatrix = gcrma(..., 'Method', MethodValue, ...) задает метод, чтобы оценить сигнал. Выбором является MLE, более быстрый, оперативный Оценочный метод Наибольшего правдоподобия, или EB, более медленный, более формальный, эмпирический метод Бейеса. Значением по умолчанию является MLE.

ExpressionMatrix = gcrma(..., 'TuningParam', TuningParamValue, ...) задает настраивающийся параметр, используемый оценочным методом. Этот настраивающий параметр устанавливает нижнюю границу значений сигналов с положительной вероятностью. Выбором является положительное значение. Значением по умолчанию является 5 (MLE) или 0.5 (EB).

Совет

Для получения информации об определении установки для этого параметра смотрите Ву и др., 2004.

ExpressionMatrix = gcrma(..., 'GSBCorr', GSBCorrValue, ...) задает, выполнить ли исправление гена определенной привязки (GSB) с помощью тестовых данных о сродстве. Выбором является true (значение по умолчанию) или false. Если нет никакой тестовой информации о сродстве, это свойство проигнорировано.

ExpressionMatrix = gcrma(..., 'Normalize', NormalizeValue, ...) средства управления, выполняется ли нормализация квантиля на фоновых скорректированных данных. Выбором является true (значение по умолчанию) или false.

ExpressionMatrix = gcrma(..., 'Verbose', VerboseValue, ...) управляет отображением отчета о выполнении работ, показывающего количество каждого чипа, когда это завершается. Выбором является true (значение по умолчанию) или false.

Примеры

  1. Загрузите MAT-файл, включенный с программным обеспечением Bioinformatics Toolbox™, которое содержит данные Affymetrix из исследования рака простаты. Переменные в MAT-файле включают seqMatrix, матрицу, содержащую информацию о последовательности для зондов PM, pmMatrix и mmMatrix, матриц, содержащих PM и значения интенсивности зонда MM и probeIndices, вектор-столбец, содержащий информацию об индексации зонда.

    load prostatecancerrawdata
  2. Вычислите PM Affymetrix и сродство зонда MM от их последовательностей и интенсивности зонда MM.

    [apm, amm] = affyprobeaffinities(seqMatrix, mmMatrix(:,1),...
                 'ProbeIndices', probeIndices);
  3. Выполните фоновую корректировку GCRMA, нормализацию квантиля и резюмирование Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов и создайте матрицу значений выражения.

    expdata = gcrma(pmMatrix, mmMatrix, probeIndices, seqMatrix);

Файл prostatecancerrawdata.mat, используемый в этом примере, содержит данные из Лучшего и др., 2005.

Ссылки

[1] Ву, Z., Irizarry, R.A., джентльмен, Р., Мурильо, F.M., и Спенсер, F. (2004). Основанная на модели фоновая корректировка к массивам выражения олигонуклеотида. Журнал американской статистической ассоциации 99 (468), 909–917.

[2] Ву, Z., и Irizarry, R.A. (2005). Стохастические модели, вдохновленные теорией гибридизации для коротких массивов олигонуклеотида. Продолжения RECOMB 2004. J Comput Biol. 12 (6), 882–93.

[3] Ву, Z., и Irizarry, R.A. (2005). Статистическая среда для анализа данных Тестового Уровня микромассивов. Университет Джонса Хопкинса, рабочие документы биостатистики 73.

[4] Скорость, T. (2006). Фоновые модели и GCRMA. Читайте лекции 10, Статистика 246, Калифорнийский университет Беркли.

[5] Лучше всего, C.J.M., Гиллеспи, J.W., И, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Эриксон, H.S., Георгевич, L., Tangrea, M.A., Duray, P.H., Гонсалес, S., Веласко, A., Linehan, W.M., Matusik, R.J., Цена, D.K., Figg, W.D., Emmert-маркер, M.R., и Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке простаты после терапии абляции андрогена. Клинические Исследования рака 11, 6823–6834.

Представленный в R2007a

Для просмотра документации необходимо авторизоваться на сайте