exponenta event banner

celintensityread

Считывание интенсивности зондов из файлов Affymetrix CEL

Синтаксис

ProbeStructure = celintensityread(CELFiles, CDFFile)
ProbeStructure = celintensityread(..., 'CELPath', CELPathValue, ...)
ProbeStructure = celintensityread(..., 'CDFPath', CDFPathValue, ...)
ProbeStructure = celintensityread(..., 'PMOnly', PMOnlyValue, ...)
ProbeStructure = celintensityread(..., 'Verbose', VerboseValue, ...)

Входные аргументы

CELFiles

Любое из следующих действий:

  • Символьный вектор или строка, указывающая одно имя файла CEL.

  • '*', которая считывает все файлы CEL в текущей папке.

  • ' ', в котором открывается диалоговое окно «Выбор файлов CEL», в котором выбираются файлы CEL. В этом диалоговом окне можно нажать и удерживать клавишу CTRL или SHIFT, чтобы выбрать несколько файлов CEL.

  • Массив ячеек символьных векторов или строковых векторов, содержащих имена CEL-файлов.

CDFFile

Одно из следующих действий:

  • Символьный вектор или строка, указывающая имя файла CDF.

  • ' ', в котором открывается диалоговое окно «Выбор файла CDF», в котором выбирается файл CDF.

CELPathValueСимвольный вектор или строка, указывающая путь и папку, в которых указаны файлы CELFiles хранятся.
CDFPathValueСимвольный вектор или строка, указывающая путь и папку, в которой указан файл CDFFile хранится.
PMOnlyValueСвойство для включения или исключения значений интенсивности зонда несоответствия (MM) в возвращаемой структуре. Войти true для возврата только интенсивности зонда идеального соответствия (PM). Войти false для возврата интенсивностей зондов PM и MM. По умолчанию: true.
VerboseValueУправляет отображением отчета о ходе выполнения, отображающего имя каждого файла CEL при его чтении. Когда VerboseValue является false, отчет о ходе выполнения не отображается. По умолчанию: true.

Выходные аргументы

ProbeStructureСтруктура MATLAB ® содержит информацию из файлов CEL, включая интенсивности зондов, индексы зондов и идентификаторы наборов зондов.

Описание

ProbeStructure = celintensityread(CELFiles, CDFFile) считывает указанные файлы Affymetrix ® CEL и связанный файл библиотеки CDF (созданный из массивов Affymetrix GeneChip ® для анализа экспрессии или генотипирования), а затем создаетProbeStructureструктура, содержащая информацию из файлов CEL, включая интенсивности зондов, индексы зондов и идентификаторы наборов зондов. CELFiles - символьный вектор, строка, строковый вектор или массив ячеек символьных векторов, содержащих имена CEL-файлов. CDFFile - символьный вектор или строка, задающая имя файла CDF.

Если установить CELFiles кому '*'затем считывает все файлы CEL в текущей папке. Если установить CELFiles кому ' 'затем открывается диалоговое окно «Выбор файлов CEL», в котором можно выбрать файлы CEL. В этом диалоговом окне можно нажать и удерживать клавишу CTRL или SHIFT, чтобы выбрать несколько файлов CEL.

Если установить CDFFile кому ' 'затем открывается диалоговое окно «Выбор файла CDF», в котором выбирается файл CDF.

ProbeStructure = celintensityread(..., 'PropertyName', PropertyValue, ...) требования celintensityread с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

ProbeStructure = celintensityread(..., 'CELPath', CELPathValue, ...) указывает путь и папку, в которых файлы указаны CELFiles хранятся.

ProbeStructure = celintensityread(..., 'CDFPath', CDFPathValue, ...) указывает путь и папку, в которой файл указан CDFFile хранится.

ProbeStructure = celintensityread(..., 'PMOnly', PMOnlyValue, ...) включает или исключает значения интенсивности зонда несовпадения (MM). Когда PMOnlyValue является true, celintensityread возвращает только интенсивности зонда совершенного соответствия (PM). Когда PMOnlyValue является false, celintensityread возвращает значения интенсивности зондов PM и MM. По умолчанию: true.

Совет

Чтение большого количества CEL-файлов и/или большого CEL-файла может потребовать от операционной системы больших объемов памяти.

ProbeStructure содержит следующие поля.

ОбластьОписание
CDFName

Имя файла библиотеки Affymetrix CDF.

CELNames

Массив ячеек имен файлов Affymetrix CEL.

NumChips

Количество файлов CEL, считанных в структуру.

NumProbeSets

Количество наборов зондов в каждом файле CEL.

NumProbes

Количество зондов в каждом файле CEL.

ProbeSetIDs

Массив ячеек идентификаторов набора зондов из файла библиотеки Affymetrix CDF.

ProbeIndices

Вектор столбца, содержащий информацию индексации зонда. Зонды в наборе зондов нумеруются 0 через N - 1, где N - количество зондов в наборе зондов.

GroupNumbers

Вектор столбца, содержащий номера групп для зондов в наборе зондов. Для данных экспрессии генов номер группы для всех зондов 1. Для данных SNP (генотипирование) номера групп для зондов:

  • 1 - Аллель A - (смысл)

  • 2 - Аллель B - (смысл)

  • 3 - Аллель А + (антисмысловой)

  • 4 - Аллель В + (антисмысловой)

PMIntensities

Матрица, содержащая значения интенсивности зонда совершенного соответствия (PM). Каждая строка соответствует тесту, а каждый столбец - CEL-файлу. Строки упорядочены так же, как в ProbeIndices, и столбцы упорядочены так же, как в CELFiles входной аргумент.

MMIntensities (необязательно)

Матрица, содержащая значения интенсивности зонда рассогласования (MM). Каждая строка соответствует тесту, а каждый столбец - CEL-файлу. Строки упорядочены так же, как в ProbeIndices, и столбцы упорядочены так же, как в CELFiles входной аргумент.

ProbeStructure = celintensityread(..., 'Verbose', VerboseValue, ...) управляет отображением отчета о ходе выполнения, отображающего имя каждого файла CEL при его чтении. Когда VerboseValue является false, отчет о ходе выполнения не отображается. По умолчанию: true.

Примеры

В следующем примере предполагается наличие HG_U95Av2.CDF файл библиотеки, хранящийся в D:\Affymetrix\LibFiles\HGGenomeи что текущая папка указывает на расположение, содержащее файлы CEL, связанные с этим файлом библиотеки CDF. В этом примере celintensityread функция считывает все файлы CEL в текущей папке и файл CDF в указанной папке. В следующей командной строке используется rmabackadj для выполнения фоновой регулировки интенсивностей зонда PM в PMIntensities поле PMProbeStructure.

PMProbeStructure = celintensityread('*', 'HG_U95Av2.CDF',...
	                  'CDFPath', 'D:\Affymetrix\LibFiles\HGGenome');
BackAdjustedMatrix = rmabackadj(PMProbeStructure.PMIntensities);

Представлен в R2006a