exponenta event banner

zonebackadj

Выполнить фоновую корректировку данных уровня зонда микрочипа Affymetrix зональным методом

Синтаксис

BackAdjustedData = zonebackadj(Data)
[BackAdjustedData, ZoneStruct] = zonebackadj(Data)
[BackAdjustedData, ZoneStruct, Background] = zonebackadj(Data)
... = zonebackadj(Data, ...'NumZones', NumZonesValue, ...)
... = zonebackadj(Data, ...'Percent', PercentValue, ...)
... = zonebackadj(Data, ...'SmoothFactor', SmoothFactorValue, ...)
... = zonebackadj(Data, ...'NoiseFrac', NoiseFracValue, ...)
... = zonebackadj(Data, ...'CDF', CDFValue, ...)
... = zonebackadj(Data, ...'Mask', MaskValue, ...)
... = zonebackadj(Data, ...'Showplot', ShowplotValue, ...)

Входные аргументы

Data Одно из следующих действий:
  • Структура MATLAB ®, содержащая интенсивности зондов из файла Affymetrix ® CEL, такие как возвращенные affyread используется для чтения файла CEL.

  • Массив структур MATLAB, содержащих интенсивности зондов из нескольких файлов Affymetrix CEL.

NumZonesValue Скалярный или двухэлементный вектор, указывающий количество зон, используемых при корректировке фона. Если скаляр, он должен быть квадратным числом. Если двухэлементный вектор, первый элемент указывает количество строк, а второй элемент - количество столбцов в некварной сетке. По умолчанию: 16.
PercentValueЗначение, указывающее процент, P, такой, что самый низкий P процент ранжированных значений интенсивности для каждой зоны используется для оценки фона для этой зоны. По умолчанию: 2.
SmoothFactorValueЗначение, определяющее коэффициент сглаживания, используемый при вычислении средневзвешенного вклада каждой зоны в фон точки. По умолчанию: 100.
NoiseFracValueЗначение, определяющее долю шума, NF, так что значение, скорректированное по фону, задается max((Intensity - WeightedBackground), NF*LocalNoiseEstimate). По умолчанию: 0.5.
CDFValueОдно из следующих действий:
  • Символьный вектор или строка, указывающая имя файла или путь и имя файла библиотеки Affymetrix CDF. Если указано только имя файла, файл должен находиться в пути поиска MATLAB или в текущей папке.

  • Структура MATLAB, содержащая информацию из файла библиотеки Affymetrix CDF, например, affyread используется для чтения файла CDF.

Файл или структура библиотеки CDF определяет ячейки управления, которые не используются в фоновых оценках.
MaskValueЛогический вектор, указывающий, какие ячейки следует маскировать, а какие не использовать в фоновых оценках. В векторе, 0 = not masked и 1 = masked. Значения по умолчанию - это значения в Masked в столбце Probes в поле файла CEL.
ShowplotValue

Управляет выводом на печать изображения фоновых оценок. Варианты: true или false (по умолчанию).

Выходные аргументы

BackAdjustedDataМатрица или клеточный массив векторов, содержащих скорректированные по фону значения интенсивности зонда.
ZoneStructСтруктура MATLAB, содержащая центры зон, используемых для корректировки фона, и оценки фоновых значений в центре каждой зоны.
BackgroundМатрица или клеточный массив векторов, содержащий оцененные фоновые значения для каждого зонда.

Описание

BackAdjustedData = zonebackadj(Data) возвращает скорректированную в фоновом режиме интенсивность зонда из Data, который содержит интенсивности зондов из файлов Affymetrix CEL. Подробная информация об фоновой корректировке описана в документе Описание статистических алгоритмов.

[BackAdjustedData, ZoneStruct] = zonebackadj(Data) также возвращает структуру, содержащую центры зон, используемых для корректировки фона, и оценки фоновых значений в центре каждой зоны.

[BackAdjustedData, ZoneStruct, Background] = zonebackadj(Data) также возвращает матрицу или клеточный массив векторов, содержащих оцененные фоновые значения для каждого зонда.

... = zonebackadj(Data, ...'PropertyName', PropertyValue, ...) требования zonebackadj с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

... = zonebackadj(Data, ...'NumZones', NumZonesValue, ...) определяет количество зон, используемых при корректировке фона. NumZonesValue может быть скаляром, который является квадратным числом, или двухэлементным массивом, в котором первый элемент указывает количество строк, а второй элемент указывает количество столбцов в некварной сетке. По умолчанию: 16.

... = zonebackadj(Data, ...'Percent', PercentValue, ...) задает процент, P, такой, что самый низкий P процент ранжированных значений интенсивности для каждой зоны используется для оценки фона для этой зоны. По умолчанию: 2.

... = zonebackadj(Data, ...'SmoothFactor', SmoothFactorValue, ...) задает коэффициент сглаживания, используемый при вычислении средневзвешенного значения вклада каждой зоны в фон точки, обеспечивая тем самым плавный переход между зонами. По умолчанию: 100.

... = zonebackadj(Data, ...'NoiseFrac', NoiseFracValue, ...) задает долю шума, так что значение, скорректированное по фону, задается max((Intensity - WeightedBackground), NF*LocalNoiseEstimate), где NF является NoiseFracValue. По умолчанию: 0.5.

... = zonebackadj(Data, ...'CDF', CDFValue, ...) задает файл или структуру библиотеки CDF Affymetrix, которая определяет ячейки управления, которые не используются в фоновых оценках.

... = zonebackadj(Data, ...'Mask', MaskValue, ...) задает логический вектор, определяющий, какие ячейки следует маскировать, а какие не использовать в фоновых оценках. В векторе, 0 = not masked и 1 = masked. Значения по умолчанию - это значения в Masked в столбце Probes в поле файла CEL.

... = zonebackadj(Data, ...'Showplot', ShowplotValue, ...) строит график фоновых оценок. Варианты: true или false (по умолчанию).

Примеры

свернуть все

В этом примере используются данные образца из антисмыслового массива генома E. coli. Загрузите данные из Demo_Data_E-coli-antisense.zip. Извлеките файлы данных из архива DTT с помощью инструмента передачи данных.

Также необходимо загрузить файл Ecoli_ASv2.CDF библиотеки для антисмыслового массива генома кишечной палочки. У вас уже могут быть эти файлы, если на вашем компьютере установлено какое-либо программное обеспечение Affymetrix GeneChip. Если нет, получите файлы библиотеки, загрузив и распаковав zip-файл E.coli Antisense Genome Array.

Считывание содержимого CEL-файла в структуру MATLAB.

celStruct = affyread('Ecoli-antisense-121502.CEL');

Считывание содержимого CDF-файла в структуру MATLAB.

cdfStruct = affyread('C:\LibFiles\Ecoli_ASv2.CDF');

Используйте zonebackadj функция для возврата матрицы или массива ячеек векторов, содержащих оцененные фоновые значения для каждого зонда.

[baData,zones,background] = zonebackadj(celStruct,'cdf',cdfStruct);

Создание таблицы значений интенсивности для argG_b3172_at набор зондов.

psvals = probesetvalues(celStruct, cdfStruct, 'argG_b3172_at',...
         'background',background)
psvals =

   1.0e+03 *

  Columns 1 through 7

    5.2120         0         0    0.0454    0.4300    0.1770    0.1690
    5.2120    0.0010         0    0.0455    0.4310    0.1770    0.1273
    5.2120    0.0020         0    0.0455    0.4320    0.1770    0.1270
    5.2120    0.0030         0    0.0455    0.4330    0.1770    0.1333
    5.2120    0.0040         0    0.0455    0.4340    0.1770    0.2123
    5.2120    0.0050         0    0.0455    0.4350    0.1770    0.1495
    5.2120    0.0060         0    0.0455    0.4360    0.1770    0.0503
    5.2120    0.0070         0    0.0456    0.4370    0.1770    0.1525
    5.2120    0.0080         0    0.0456    0.4380    0.1770    0.1645
    5.2120    0.0090         0    0.0456    0.4390    0.1770    0.1260
    5.2120    0.0100         0    0.0456    0.4400    0.1770    0.0540
    5.2120    0.0110         0    0.0456    0.4410    0.1770    0.0833
    5.2120    0.0120         0    0.0457    0.4420    0.1770    0.0955
    5.2120    0.0130         0    0.0457    0.4430    0.1770    0.1100
    5.2120    0.0140         0    0.0457    0.4440    0.1770    0.2510

  Columns 8 through 14

    0.0354    0.0250         0         0    0.4300    0.1780    0.1635
    0.0218    0.0300         0         0    0.4310    0.1780    0.1003
    0.0237    0.0300         0         0    0.4320    0.1780    0.1750
    0.0259    0.0360         0         0    0.4330    0.1780    0.0940
    0.0433    0.0360         0         0    0.4340    0.1780    0.1718
    0.0275    0.0360         0         0    0.4350    0.1780    0.1540
    0.0112    0.0300         0         0    0.4360    0.1780    0.0460
    0.0377    0.0360         0         0    0.4370    0.1780    0.1070
    0.0312    0.0360         0         0    0.4380    0.1780    0.0973
    0.0234    0.0360         0         0    0.4390    0.1780    0.1213
    0.0112    0.0360         0         0    0.4400    0.1780    0.0540
    0.0174    0.0360         0         0    0.4410    0.1780    0.0623
    0.0171    0.0300         0         0    0.4420    0.1780    0.0840
    0.0196    0.0360         0         0    0.4430    0.1780    0.0925
    0.0460    0.0360         0         0    0.4440    0.1780    0.1118

  Columns 15 through 20

    0.0241    0.0300         0         0    0.0010    0.0020
    0.0146    0.0360         0         0    0.0010    0.0020
    0.0286    0.0360         0         0    0.0010    0.0020
    0.0227    0.0300         0         0    0.0010    0.0020
    0.0365    0.0300         0         0    0.0010    0.0020
    0.0303    0.0300         0         0    0.0010    0.0020
    0.0098    0.0250         0         0    0.0010    0.0020
    0.0210    0.0360         0         0    0.0010    0.0020
    0.0219    0.0360         0         0    0.0010    0.0020
    0.0253    0.0360         0         0    0.0010    0.0020
    0.0129    0.0360         0         0    0.0010    0.0020
    0.0125    0.0360         0         0    0.0010    0.0020
    0.0186    0.0300         0         0    0.0010    0.0020
    0.0220    0.0360         0         0    0.0010    0.0020
    0.0207    0.0360         0         0    0.0010    0.0020

Ссылки

[1] Документ с описанием статистических алгоритмов, https://www.affymetrix.com/support/technical/whitepapers/ sadd_whitepaper.pdf

Представлен в R2007b