rmasummary

Вычислите значения экспрессии генов из данных уровня зонда микромассивов Affymetrix с помощью процедуры Robust Multi-array Average (RMA)

Синтаксис

ExpressionMatrix = rmasummary(ProbeIndices, Data)
ExpressionMatrix = rmasummary(ProbeIndices, Data, 'Output', OutputValue)

Аргументы

ProbeIndices

Вектор-столбец индексов зондов. Условием для индексов зонда является, для каждого набора зондов, пометить каждый зонд 0 на N  -1, где N количество зондов в наборе зондов.

Совет

Используйте ProbeIndices поле в структуре, возвращенной celintensityread как ProbeIndices вход.

Data

Матрица значений интенсивности естественной шкалы, где каждая строка соответствует зонду совершенного соответствия (PM), и каждый столбец соответствует Affymetrix® Файл CEL. (Каждый файл CEL генерируется из отдельного чипа. Все чипы должны быть одного типа.)

Совет

Использование матрицы с одной точностью для Data уменьшает использование памяти.

Совет

Можно использовать матрицу из PMIntensities поле в структуре, возвращенной celintensityread как Data вход. Однако сначала убедитесь, что матрица была скорректирована в фоновом режиме, используя rmabackadj или gcrmabackadjfunction, и нормализованный, с использованием quantilenorm функция.

OutputValue

Задает шкалу возвращенных значений экспрессии генов. OutputValue могут быть:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • functionname

В последнем случае данные преобразуются как определено функцией functionname. По умолчанию это 'log2'.

Описание

ExpressionMatrix = rmasummary(ProbeIndices, Data) возвращает значения экспрессии гена (набора зондов) после вычисления их из интенсивности зонда естественной шкалы в матрице Data, используя вектор-столбец индексов зондов, ProbeIndices. Обратите внимание, что каждая строка в Data соответствует зонду идеального соответствия (PM), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL генерируется из отдельного чипа. Все чипы должны быть одного типа.) Обратите внимание, что вектор-столбец ProbeIndices определяет зонды в каждом наборе зондов путем маркировки каждого зонда 0 на N  -1, где N количество зондов в наборе зондов. Обратите внимание, что каждая строка в ExpressionMatrix соответствует гену (набору зондов) и каждому столбцу в ExpressionMatrix соответствует файлу Affymetrix CEL, который представляет одну микросхему.

Для данного n набора зондов с J парами зондов позвольте Yijn обозначить скорректированное по фону, журналу базы 2 преобразованное и нормированное по квантованию значение интенсивности зонда PM чип- i и j зонда. Yijn следуют линейной аддитивной модели:

Yijn = Uin + Ajn + Eijn; i = 1..., I; j = 1..., J; n = 1..., N

где:

Uin = Экспрессия генов набора зондов, n на чипе i

Ajn = эффект сродства зонда для j-го зонда в наборе зондов

Eijn = Остаточный для j-го зонда на i-м чипе

Метод RMA принимает A1 + A2 +... + AJ = 0 для всех наборов зондов. Устойчивая процедура, медианная польская процедура, оценивает Ui как меру выражения логарифмической шкалы.

Примечание

Нет столбца в ExpressionMatrix который содержит набор зондов или информацию о генах.

ExpressionMatrix = rmasummary (..., 'PropertyName', PropertyValue, ...) вызывает rmasummary с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

ExpressionMatrix = rmasummary(ProbeIndices, Data, 'Output', OutputValue) задает шкалу возвращенных значений экспрессии генов. OutputValue могут быть:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • functionname

В последнем случае данные преобразуются как определено функцией functionname. По умолчанию это 'log2'.

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, которое содержит переменные данных Affymetrix, включая pmMatrix, матрица значений интенсивности пробы PM из нескольких файлов CEL.

    load prostatecancerrawdata
  2. Выполните настройку фона на значениях интенсивности зонда PM в матрице, pmMatrix, с использованием rmabackadj функция, тем самым создавая новую матрицу, BackgroundAdjustedMatrix.

    BackgroundAdjustedMatrix = rmabackadj(pmMatrix);
  3. Нормализуйте данные в BackgroundAdjustedMatrix, с использованием quantilenorm функция.

    NormMatrix = quantilenorm(BackgroundAdjustedMatrix);
  4. Вычислите значения экспрессии генов из интенсивности зонда в NormMatrix, создав новую матрицу, ExpressionMatrix. (Используйте probeIndices Вектор-столбец предоставляется для предоставления информации об индексах зонда.)

    ExpressionMatrix = rmasummary(probeIndices, NormMatrix);

The prostatecancerrawdata.mat файл, используемый в предыдущем примере, содержит данные Best et al., 2005.

Ссылки

[1] Irizarry, R.A., Hobbs, B., Collin, F., Beazer-Barclay, Y.D., Antonellis, K.J., Scherf, U., Speed, T.P. (2003). Исследования, нормализация и сводные данные данных уровня зонда олигонуклеотидного массива высокой плотности. Биостатистика. 4, 249–264.

[2] Mosteller, F., and Tukey, J. (1977). Анализ и регрессия данных (Reading, Massachusetts: Addison-Wesley Publishing Company), стр. 165-202.

[3] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собери, Я., Эриксон, Х.С., Георгиевич, Л., Тангрея, М.А., Duray, P.H., Gonsalez, S., Velasco, A., Linehan, W.M., Matusik, R.J., Price, D.K., Figg, W.D., Emmert-Buck, M.R., and Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке предстательной железы после андрогенной абляции. Клинические исследования рака 11, 6823-6834.

Введенный в R2006a