affyrma

Выполните процедуру Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов

Синтаксис

Expression = affyrma(CELFiles, CDFFile)
Expression = affyrma(ProbeStructure)
Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...)
Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...)
Expression = affyrma(..., 'Method', MethodValue, ...)
Expression = affyrma(..., 'Truncate', TruncateValue, ...)
Expression = affyrma(..., 'Median', MedianValue, ...)
Expression = affyrma(..., 'Output', OutputValue, ...)
Expression = affyrma(..., 'Showplot', ShowplotValue, ...)
Expression = affyrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

CELFiles

Любое следующее:

  • Вектор символов или строка, задающая одно имя файла CEL.

  • '*', который читает все файлы CEL в текущей папке.

  • ' ', который открывает диалоговое окно Select CEL Files, из которого вы выбираете файлы CEL. От этого диалогового окна можно нажать и содержать Ctrl или Shift при нажатии, чтобы выбрать несколько файлов CEL.

  • Массив ячеек из символьных векторов или вектор строки, содержащий имена файлов CEL.

CDFFile

Любое из следующего:

  • Вектор символов или строка, задающая имя CDF-файла.

  • ' ', который открывает диалоговое окно Select CDF File, из которого вы выбираете CDF-файл.

ProbeStructure

Структура MATLAB®, содержащая информацию из файлов CEL, включая тестовую интенсивность, зондирует индексы и тестовые идентификаторы набора, возвращенные функцией celintensityread.

CELPathValue

Вектор символов или строка, задающая путь и папку, где файлы, заданные в CELFiles, хранятся.

CDFPathValue

Вектор символов или строка, задающая путь и папку, где файл, заданный в CDFFile, хранится.

MethodValue

Задает метод оценки для фоновых параметров модели корректировки. Выбором является 'RMA' (чтобы использовать метод оценки, описанный Bolstad, 2005) или 'MLE' (чтобы оценить параметры с помощью наибольшего правдоподобия). Значением по умолчанию является 'RMA'.

TruncateValue

Задает модель фонового шума. Выбором является true (используйте усеченное Распределение Гаусса), или false (используют неусеченное Распределение Гаусса). Значением по умолчанию является true.

MedianValue

Задает использование медианы оцениваемых значений вместо среднего значения для нормализации. Выбором является true или false (значение по умолчанию).

OutputValue

Задает шкалу возвращенных значений экспрессии гена. Выбор:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • @functionname

В последнем экземпляре данные преобразовываются, как задано функциональным functionname. Значением по умолчанию является 'log2'.

ShowplotValue

Управляет графическим выводом гистограммы, показывающей распределение (синих) значений интенсивности зонда PM и замысловатая (красная) функция распределения вероятностей, с предполагаемыми параметрами mu, сигмой и альфой. Введите или 'all' (постройте гистограмму для каждого столбца или чипа), или задайте подмножество столбцов (микросхемы) путем ввода номера столбца, списка чисел или области значений чисел.

Например:

  • (..., 'Showplot', 3, ...) строит значения интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7], ...) строит значения интенсивности в столбцах 3, 5, и 7.

  • (..., 'Showplot', 3:9, ...) строит значения интенсивности в столбцах 3 - 9.

VerboseValue

Управляет отображением состояния чтения обработки RMA и файлов. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

Expression

Объект DataMatrix, содержащий log2, основывал значения экспрессии гена, которые были настроенным фоном, нормированным, и полученное в итоге использование процедуры Устойчивого среднего значения мультимассивов (RMA).

Каждая строка в Expression соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix® CEL.

Описание

Expression = affyrma(CELFiles, CDFFile) читает заданные файлы Affymetrix CEL и связанный файл библиотеки CDF (созданный из массивов Affymetrix GeneChip® для испытания выражения или генотипирования), обрабатывает тестовые значения интенсивности с помощью фоновой корректировки RMA, нормализации квантиля, и процедур резюмирования, затем возвращает Expression, объект DataMatrix, содержащий log2, основывал значения экспрессии гена в матрице, тестовые идентификаторы набора, как строка называет, и имена файлов CEL как имена столбцов. Обратите внимание на то, что каждая строка в Expression соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

CELFiles является вектором символов, строкой, вектором строки или массивом ячеек из символьных векторов, содержащим имена файлов CEL. CDFFile является вектором символов или строкой, задающей имя CDF-файла. Если вы устанавливаете CELFiles на '*', то это читает все файлы CEL в текущей папке. Если вы устанавливаете CELFiles на ' ', то это открывает диалоговое окно Select CEL Files, из которого вы выбираете файлы CEL.

Примечание

Для получения дополнительной информации на чтении файлов и обработке RMA, смотрите celintensityread, rmabackadj, quantilenorm и rmasummary.

Expression = affyrma(ProbeStructure) использование фоновая корректировка RMA, нормализация квантиля и процедуры резюмирования, чтобы обработать тестовые значения интенсивности в ProbeStructure, структура MATLAB, содержащая информацию из файлов CEL, включая тестовую интенсивность, тестовые индексы и тестовые идентификаторы набора, возвращенные функцией celintensityread, и, возвращает Expression.

Expression = affyrma(..., 'PropertyName', PropertyValue, ...) вызывает affyrma с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...) задает путь и папку, где файлы, заданные CELFiles, хранятся.

Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...) задает путь и папку, где файл, заданный CDFFile, хранится.

Expression = affyrma(..., 'Method', MethodValue, ...) задает метод оценки для фоновых параметров модели корректировки. Когда MethodValue является 'RMA', affyrma реализует метод оценки, описанный Bolstad, 2005. Когда MethodValue является 'MLE', affyrma оценивает параметры с помощью наибольшего правдоподобия. Значением по умолчанию является 'RMA'.

Expression = affyrma(..., 'Truncate', TruncateValue, ...) задает используемую модель фонового шума. Когда TruncateValue является false, affyrma использует неусеченный Гауссов в качестве модели фонового шума. Значением по умолчанию является true.

Expression = affyrma(..., 'Median', MedianValue, ...) задает использование медианы оцениваемых значений вместо среднего значения для нормализации. Выбором является true или false (значение по умолчанию).

Expression = affyrma(..., 'Output', OutputValue, ...) задает шкалу возвращенных значений экспрессии гена. OutputValue может быть:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • @functionname

В последнем экземпляре данные преобразовываются, как задано функциональным functionname. Значением по умолчанию является 'log2'.

Expression = affyrma(..., 'Showplot', ShowplotValue, ...) позволяет вам построить гистограмму, показывающую распределение (синих) значений интенсивности зонда PM и замысловатая (красная) функция распределения вероятностей, с предполагаемыми параметрами mu, сигмой и альфой. Когда ShowplotValue является 'all', rmabackadj строит гистограмму для каждого столбца или чипа. Когда ShowplotValue является номером, списком чисел или областью значений чисел, rmabackadj строит гистограмму для обозначенного номера столбца (чип).

Например:

  • (..., 'Showplot', 3,...) строит значения интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7],...) строит значения интенсивности в столбцах 3, 5, и 7.

  • (..., 'Showplot', 3:9,...) строит значения интенсивности в столбцах 3 - 9.

Expression = affyrma(..., 'Verbose', VerboseValue, ...) управляет отображением состояния чтения обработки RMA и файлов. Выбором является true (значение по умолчанию) или false.

Примеры

Следующий пример принимает, что у вас есть файл библиотеки HG_U95Av2.CDF, хранивший в D:\Affymetrix\LibFiles\HGGenome, и что ваша текущая папка указывает на местоположение, содержащее файлы CEL, сопоставленные с этим файлом библиотеки CDF. В этом примере функция affyrma читает все файлы CEL в текущей папке и CDF-файл в заданной папке. Это также выполняет фоновую корректировку RMA, нормализацию квантиля и процедуры резюмирования на значениях интенсивности зонда премьер-министра, и возвращает объект DataMatrix, содержа метаданные и обработанные данные.

Expression = affyrma('*', 'HG_U95Av2.CDF',...
	                    'CDFPath', 'D:\Affymetrix\LibFiles\HGGenome');

Ссылки

[1] Irizarry, R.A., Хоббс, B., Коллин, F., Бизер-Барклай, Y.D., Antonellis, K.J., Scherf, U., скорость, T.P. (2003). Исследование, нормализация и сводные данные данных об уровне зонда олигонуклеотида высокой плотности массивов. Биостатистика. 4, 249–264.

[2] Mosteller, F. и Tukey, J. (1977). Анализ данных и Регрессия (Чтение, Массачусетс: Издательство Аддисона-Уэсли), стр 165–202.

[3] Лучше всего, C.J.M., Гиллеспи, J.W., И, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Эриксон, H.S., Георгевич, L., Tangrea, M.A., Duray, P.H., Гонсалес, S., Веласко, A., Linehan, W.M., Matusik, R.J., Цена, D.K., Figg, W.D., Emmert-маркер, M.R., и Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке простаты после терапии абляции андрогена. Клинические Исследования рака 11, 6823–6834.

[4] Bolstad, B. (2005). “affy: встроенные методы обработки” https://www.bioconductor.org/packages/2.1/bioc/vignettes/affy/ inst/doc/builtinMethods.pdf

Представленный в R2008b