affyrma

Выполните процедуру Robust Multi-array Average (RMA) для данных уровня зонда микромассива Affymetrix

Синтаксис

Expression = affyrma(CELFiles, CDFFile)
Expression = affyrma(ProbeStructure)
Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...)
Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...)
Expression = affyrma(..., 'Method', MethodValue, ...)
Expression = affyrma(..., 'Truncate', TruncateValue, ...)
Expression = affyrma(..., 'Median', MedianValue, ...)
Expression = affyrma(..., 'Output', OutputValue, ...)
Expression = affyrma(..., 'Showplot', ShowplotValue, ...)
Expression = affyrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

CELFiles

Любое из следующих:

  • Вектор символов или строка, задающая одно имя файла CEL.

  • '*', который считывает все файлы CEL в текущей папке.

  • ' ', который открывает диалоговое окно «Выбор файлов CEL», из которого вы выбираете файлы CEL. В этом диалоговом окне можно нажать и удерживать Ctrl или Shift при щелчке мыши, чтобы выбрать несколько файлов CEL.

  • Массив ячеек из символьных векторов или строкового вектора, содержащего имена файлов CEL.

CDFFile

Одно из следующих:

  • Вектор символов или строка, задающая имя CDF-файла.

  • ' ', который открывает диалоговое окно Выбор CDF-файл, из которого вы выбираете CDF-файл.

ProbeStructure

MATLAB® структура, содержащая информацию из файлов CEL, включая интенсивность зондирования, индексы зондов и идентификаторы набора зондов, возвращенные celintensityread функция.

CELPathValue

Вектор символов или строка, указывающая путь и папку, где файлы, указанные в CELFiles хранятся.

CDFPathValue

Вектор символов или строка, указывающая путь и папку, в которой находится файл, указанный в CDFFile сохранен.

MethodValue

Задает метод оценки для параметров модели корректировки фона. Варианты 'RMA' (для использования метода оценки, описанного Болстадом, 2005) или 'MLE' (для оценки параметров с использованием максимальной вероятности). По умолчанию это 'RMA'.

TruncateValue

Задает модель фонового шума. Варианты true (используйте усеченное Гауссово распределение) или false (используйте неурезанное Гауссово распределение). По умолчанию это true.

MedianValue

Задает использование медианы ранжированных значений вместо среднего для нормализации. Варианты true или false (по умолчанию).

OutputValue

Задает шкалу возвращенных значений экспрессии генов. Варианты:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • functionname

В последнем случае данные преобразуются как определено функцией functionname. По умолчанию это 'log2'.

ShowplotValue

Управляет графическим изображением гистограммы, показывающей распределение значений интенсивности зонда PM (синий) и функции свертанного распределения вероятностей (красный) с предполагаемыми параметрами mu, sigma и альфа. Введите любой из 'all' (постройте гистограмму для каждого столбца или фишки) или укажите подмножество столбцов (фишки) путем ввода номера столбца, списка чисел или области значений чисел.

Для примера:

  • (..., 'Showplot', 3, ...) строит графики значений интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7], ...) Строит графики значений интенсивности в столбцах 3, 5 и 7.

  • (..., 'Showplot', 3:9, ...) Строит графики значений интенсивности в столбцах с 3 по 9.

VerboseValue

Управляет отображением состояния чтения файлов и обработки RMA. Варианты true (по умолчанию) или false.

Выходные аргументы

Expression

Объект DataMatrix, содержащий значения экспрессии генов на основе log2, которые были скорректированы, нормированы и суммированы с использованием процедуры Robust Multi-array Average (RMA).

Каждая строка в Expression соответствует гену (набору зондов), и каждый столбец соответствует Affymetrix® Файл CEL.

Описание

Expression = affyrma(CELFiles, CDFFile) считывает указанные файлы CEL Affymetrix и связанный файл библиотеки CDF (созданный из Affymetrix GeneChip® массивы для анализа экспрессии или генотипирования), обрабатывает значения интенсивности зонда с помощью корректировки фона RMA, нормализации квантиля и процедур суммирования, затем возвращает Expressionобъект DataMatrix, содержащий значения экспрессии генов на основе log2 в матрице, идентификаторы набора зондов в виде имен строк и имена файлов CEL в виде имен столбцов. Обратите внимание, что каждая строка в Expression соответствует гену (набору зондов), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL генерируется из отдельного чипа. Все чипы должны быть одного типа.)

CELFiles - вектор символов, строка, строковый вектор или массив ячеек векторов символов, содержащий имена файлов CEL. CDFFile - вектор символов или строка, задающая имя CDF-файла. Если вы задаете CELFiles на '*'затем считываются все файлы CEL в текущей папке. Если вы задаете CELFiles на ' ', затем откроется диалоговое окно Выбор файлов CEL, из которого вы выбираете файлы CEL.

Примечание

Для получения дополнительной информации о чтении файлов и обработке RMA, смотрите celintensityread, rmabackadj, quantilenorm, и rmasummary.

Expression = affyrma(ProbeStructure) использует процедуры фоновой настройки RMA, нормализации квантования и суммирования, чтобы обработать значения интенсивности зонда в ProbeStructure, структуру MATLAB, содержащую информацию из файлов CEL, включая интенсивность зондирования, индексы зондов и идентификаторы набора зондов, возвращенные celintensityread function, и возвращает Expression.

Expression = affyrma (..., 'PropertyName', PropertyValue, ...) вызывает affyrma с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...) задает путь и папку, в которой заданы файлы CELFiles хранятся.

Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...) задает путь и папку, в которой находится файл, заданный как CDFFile сохранен.

Expression = affyrma(..., 'Method', MethodValue, ...) задает метод оценки для параметров модели корректировки фона. Когда MethodValue является 'RMA', affyrma реализует метод оценки, описанный Болстадом, 2005. Когда MethodValue является 'MLE', affyrma оценивает параметры, используя максимальную правдоподобность. По умолчанию это 'RMA'.

Expression = affyrma(..., 'Truncate', TruncateValue, ...) задает используемую модель фонового шума. Когда TruncateValue является false, affyrma использует неусеченный Гауссов в качестве модели фонового шума. По умолчанию это true.

Expression = affyrma(..., 'Median', MedianValue, ...) задает использование медианы ранжированных значений вместо среднего значения для нормализации. Варианты true или false (по умолчанию).

Expression = affyrma(..., 'Output', OutputValue, ...) задает шкалу возвращенных значений экспрессии генов. OutputValue могут быть:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • functionname

В последнем случае данные преобразуются как определено функцией functionname. По умолчанию это 'log2'.

Expression = affyrma(..., 'Showplot', ShowplotValue, ...) позволяет вам построить гистограмму, показывающую распределение значений интенсивности зонда PM (синий) и свертанную функцию распределения вероятностей (красный) с предполагаемыми параметрами mu, sigma и альфа. Когда ShowplotValue является 'all', rmabackadj строит гистограмму для каждого столбца или чипа. Когда ShowplotValue - число, список чисел или область значений чисел, rmabackadj строит гистограмму для указанного номера столбца (чипа).

Для примера:

  • (..., 'Showplot', 3,...) строит графики значений интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7],...) Строит графики значений интенсивности в столбцах 3, 5 и 7.

  • (..., 'Showplot', 3:9,...) Строит графики значений интенсивности в столбцах с 3 по 9.

Expression = affyrma(..., 'Verbose', VerboseValue, ...) управляет отображением состояния чтения файлов и обработки RMA. Варианты true (по умолчанию) или false.

Примеры

Следующий пример предполагает, что у вас есть HG_U95Av2.CDF файл библиотеки, хранящийся в D:\Affymetrix\LibFiles\HGGenome, и что ваша текущая папка указывает на расположение, содержащее файлы CEL, сопоставленные с этим файлом библиотеки CDF. В этом примере, affyrma функция считывает все файлы CEL в текущей папке и CDF-файл в указанной папке. Он также выполняет настройку фона RMA, нормализацию квантиля и процедуры суммирования на значениях интенсивности зонда PM и возвращает объект DataMatrix, содержащий метаданные и обработанные данные.

Expression = affyrma('*', 'HG_U95Av2.CDF',...
	                    'CDFPath', 'D:\Affymetrix\LibFiles\HGGenome');

Ссылки

[1] Irizarry, R.A., Hobbs, B., Collin, F., Beazer-Barclay, Y.D., Antonellis, K.J., Scherf, U., Speed, T.P. (2003). Исследования, нормализация и сводные данные данных уровня зонда олигонуклеотидного массива высокой плотности. Биостатистика. 4, 249–264.

[2] Mosteller, F., and Tukey, J. (1977). Анализ и регрессия данных (Reading, Massachusetts: Addison-Wesley Publishing Company), стр. 165-202.

[3] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собери, Я., Эриксон, Х.С., Георгиевич, Л., Тангрея, М.А., Duray, P.H., Gonsalez, S., Velasco, A., Linehan, W.M., Matusik, R.J., Price, D.K., Figg, W.D., Emmert-Buck, M.R., and Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке предстательной железы после андрогенной абляции. Клинические исследования рака 11, 6823-6834.

[4] Болстад, Б. (2005). «аффи: встроенные методы обработки» https://www.bioconductor.org/packages/2.1/bioc/vignettes/affy/ inst/doc/builtinMethods.pdf

Введенный в R2008b