affyrma

Выполните процедуру Устойчивого среднего значения мультимассивов (RMA) на данных тестового уровня Affymetrix микромассивов

Синтаксис

Expression = affyrma(CELFiles, CDFFile)
Expression = affyrma(ProbeStructure)
Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...)
Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...)
Expression = affyrma(..., 'Method', MethodValue, ...)
Expression = affyrma(..., 'Truncate', TruncateValue, ...)
Expression = affyrma(..., 'Median', MedianValue, ...)
Expression = affyrma(..., 'Output', OutputValue, ...)
Expression = affyrma(..., 'Showplot', ShowplotValue, ...)
Expression = affyrma(..., 'Verbose', VerboseValue, ...)

Входные параметры

CELFiles

Любое следующее:

  • Вектор символов или строка, задающая одно имя файла CEL.

  • '*', который читает все файлы CEL в текущей папке.

  • ' ', который открывает диалоговое окно Select CEL Files, из которого вы выбираете файлы CEL. От этого диалогового окна можно нажать и содержать Ctrl или Shift при нажатии, чтобы выбрать несколько файлов CEL.

  • Массив ячеек из символьных векторов или вектор строки, содержащий имена файлов CEL.

CDFFile

Любое из следующего:

  • Вектор символов или строка, задающая имя CDF-файла.

  • ' ', который открывает диалоговое окно Select CDF File, из которого вы выбираете CDF-файл.

ProbeStructure

MATLAB® структура, содержащая информацию из файлов CEL, включая тестовую интенсивность, зондирует индексы и тестовые идентификаторы набора, возвращенные celintensityread функция.

CELPathValue

Вектор символов или строка, задающая путь и папку, где файлы заданы в CELFiles хранятся.

CDFPathValue

Вектор символов или строка, задающая путь и папку, где файл задан в CDFFile хранится.

MethodValue

Задает метод оценки для фоновых параметров модели корректировки. Выбором является 'RMA' (чтобы использовать метод оценки, описанный Bolstad, 2005) или 'MLE' (чтобы оценить параметры с помощью наибольшего правдоподобия). Значением по умолчанию является 'RMA'.

TruncateValue

Задает модель фонового шума. Выбором является true (используйте усеченное Распределение Гаусса), или false (используйте неусеченное Распределение Гаусса). Значением по умолчанию является true.

MedianValue

Задает использование медианы оцениваемых значений вместо среднего значения для нормализации. Выбором является true или false (значение по умолчанию).

OutputValue

Задает шкалу возвращенных значений экспрессии гена. Выбор:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • FunctionName

В последнем экземпляре данные преобразовываются, как задано функциональным functionname. Значением по умолчанию является 'log2'.

ShowplotValue

Управляет графическим выводом гистограммы, показывающей распределение (синих) значений интенсивности зонда PM и замысловатая (красная) функция распределения вероятностей, предполагаемыми параметрами mu, сигмой и альфой. Введите любой 'all' (постройте гистограмму для каждого столбца или чипа), или задайте подмножество столбцов (микросхемы) путем ввода номера столбца, списка чисел или области значений чисел.

Например:

  • (..., 'Showplot', 3, ...) строит значения интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7], ...) строит значения интенсивности в столбцах 3, 5, и 7.

  • (..., 'Showplot', 3:9, ...) строит значения интенсивности в столбцах 3 - 9.

VerboseValue

Управляет отображением состояния чтения обработки RMA и файлов. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

Expression

Объект DataMatrix, содержащий log2, основывал значения экспрессии гена, которые были настроенным фоном, нормированным, и полученное в итоге использование процедуры Устойчивого среднего значения мультимассивов (RMA).

Каждая строка в Expression соответствует гену (тестовый набор), и каждый столбец соответствует Affymetrix® Файл CEL.

Описание

Expression = affyrma(CELFiles, CDFFile) читает заданные файлы Affymetrix CEL и связанный файл библиотеки CDF (созданный из Affymetrix GeneChip® массивы для испытания выражения или генотипирования), обрабатывает тестовые значения интенсивности с помощью фоновой корректировки RMA, нормализации квантиля, и процедур резюмирования, затем возвращает Expression, объект DataMatrix, содержащий log2, основывал значения экспрессии гена в матрице, тестовые идентификаторы набора, как строка называет, и имена файлов CEL как имена столбцов. Обратите внимание на то, что каждая строка в Expression соответствует гену (тестовый набор), и каждый столбец соответствует файлу Affymetrix CEL. (Каждый файл CEL сгенерирован от отдельного чипа. Все микросхемы должны иметь тот же тип.)

CELFiles вектор символов, строка, вектор строки или массив ячеек из символьных векторов, содержащий имена файлов CEL. CDFFile вектор символов или строка, задающая имя CDF-файла. Если вы устанавливаете CELFiles к '*', затем это читает все файлы CEL в текущей папке. Если вы устанавливаете CELFiles к ' ', затем это открывает диалоговое окно Select CEL Files, из которого вы выбираете файлы CEL.

Примечание

Для получения дополнительной информации на чтении файлов и обработке RMA, смотрите celintensityread, rmabackadj, quantilenorm, и rmasummary.

Expression = affyrma(ProbeStructure) использование фоновая корректировка RMA, нормализация квантиля и процедуры резюмирования, чтобы обработать тестовые значения интенсивности в ProbeStructure, структура MATLAB, содержащая информацию из файлов CEL, включая тестовую интенсивность, зондирует индексы и тестовые идентификаторы набора, возвращенные celintensityread функция, и возвращает Expression.

Expression = affyrma (..., 'PropertyName', PropertyValue, ...) вызовы affyrma с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

Expression = affyrma(CELFiles, CDFFile, ...'CELPath', CELPathValue, ...) задает путь и папку где файлы, заданные CELFiles хранятся.

Expression = affyrma(CELFiles, CDFFile, ...'CDFPath', CDFPathValue, ...) задает путь и папку где файл, заданный CDFFile хранится.

Expression = affyrma(..., 'Method', MethodValue, ...) задает метод оценки для фоновых параметров модели корректировки. Когда MethodValue 'RMA', affyrma реализует метод оценки, описанный Bolstad, 2005. Когда MethodValue 'MLE', affyrma оценивает параметры с помощью наибольшего правдоподобия. Значением по умолчанию является 'RMA'.

Expression = affyrma(..., 'Truncate', TruncateValue, ...) задает используемую модель фонового шума. Когда TruncateValue false, affyrma использует неусеченный Гауссов в качестве модели фонового шума. Значением по умолчанию является true.

Expression = affyrma(..., 'Median', MedianValue, ...) задает использование медианы оцениваемых значений вместо среднего значения для нормализации. Выбором является true или false (значение по умолчанию).

Expression = affyrma(..., 'Output', OutputValue, ...) задает шкалу возвращенных значений экспрессии гена. OutputValue может быть:

  • 'log'

  • 'log2'

  • 'log10'

  • 'linear'

  • FunctionName

В последнем экземпляре данные преобразовываются, как задано функциональным functionname. Значением по умолчанию является 'log2'.

Expression = affyrma(..., 'Showplot', ShowplotValue, ...) позволяет вам построить гистограмму, показывающую распределение (синих) значений интенсивности зонда PM и замысловатая (красная) функция распределения вероятностей, предполагаемыми параметрами mu, сигмой и альфой. Когда ShowplotValue 'all', rmabackadj строит гистограмму для каждого столбца или чипа. Когда ShowplotValue номер, список чисел или область значений чисел, rmabackadj строит гистограмму для обозначенного номера столбца (чип).

Например:

  • (..., 'Showplot', 3,...) строит значения интенсивности в столбце 3.

  • (..., 'Showplot', [3,5,7],...) строит значения интенсивности в столбцах 3, 5, и 7.

  • (..., 'Showplot', 3:9,...) строит значения интенсивности в столбцах 3 - 9.

Expression = affyrma(..., 'Verbose', VerboseValue, ...) управляет отображением состояния чтения обработки RMA и файлов. Выбором является true (значение по умолчанию) или false.

Примеры

Следующий пример принимает, что у вас есть HG_U95Av2.CDF файл библиотеки хранится в D:\Affymetrix\LibFiles\HGGenome, и что ваша текущая папка указывает на местоположение, содержащее файлы CEL, сопоставленные с этим файлом библиотеки CDF. В этом примере, affyrma функционируйте читает все файлы CEL в текущей папке и CDF-файл в заданной папке. Это также выполняет фоновую корректировку RMA, нормализацию квантиля и процедуры резюмирования на значениях интенсивности зонда премьер-министра, и возвращает объект DataMatrix, содержа метаданные и обработанные данные.

Expression = affyrma('*', 'HG_U95Av2.CDF',...
	                    'CDFPath', 'D:\Affymetrix\LibFiles\HGGenome');

Ссылки

[1] Irizarry, R.A., Хоббс, B., Коллин, F., Бизер-Барклай, Y.D., Antonellis, K.J., Scherf, U., скорость, T.P. (2003). Исследование, нормализация и сводные данные данных об уровне зонда олигонуклеотида высокой плотности массивов. Биостатистика. 4, 249–264.

[2] Mosteller, F. и Tukey, J. (1977). Анализ данных и Регрессия (Чтение, Массачусетс: Издательство Аддисона-Уэсли), стр 165–202.

[3] Лучше всего, C.J.M., Гиллеспи, J.W., И, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Эриксон, H.S., Георгевич, L., Tangrea, M.A., Duray, P.H., Гонсалес, S., Веласко, A., Linehan, W.M., Matusik, R.J., Цена, D.K., Figg, W.D., Emmert-маркер, M.R., и Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке простаты после терапии абляции андрогена. Клинические Исследования рака 11, 6823–6834.

[4] Bolstad, B. (2005). “affy: встроенные методы обработки” https://www.bioconductor.org/packages/2.1/bioc/vignettes/affy/ inst/doc/builtinMethods.pdf

Представленный в R2008b
Для просмотра документации необходимо авторизоваться на сайте