exponenta event banner

affyinvarsetnorm

Выполнить нормализацию инвариантного набора рангов по интенсивностям зондов из нескольких файлов Affymetrix CEL или DAT

Синтаксис

NormData = affyinvarsetnorm(Data)
[NormData, MedStructure] = affyinvarsetnorm(Data)
... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...)
... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...)
... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...)
... affyinvarsetnorm(..., 'Method', MethodValue, ...)
... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

Data

Матрица значений интенсивности, где каждая строка соответствует зонду точного соответствия (PM), а каждый столбец соответствует файлу Affymetrix ® CEL или DAT. (Каждый файл CEL или DAT генерируется из отдельной микросхемы. Все микросхемы должны быть одного типа.)

MedStructure

Структура медианы интенсивности каждого столбца до и после нормализации и индекс столбца, выбранного в качестве базовой линии.

BaselineValue

Свойство для управления выбором индекса столбца N от Data используется в качестве столбца базовой линии. По умолчанию - индекс столбца, средняя интенсивность которого является медианой всех столбцов.

ThresholdsValue

Свойство для установки пороговых значений для наименьшего среднего ранга и наивысшего среднего ранга, которые используются для определения инвариантного множества. Инвариантное множество рангов - это множество точек данных, пропорциональная разность рангов которых меньше заданного порога. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга. Выберите эти два порога эмпирически, чтобы ограничить разброс инвариантного множества, но разрешить достаточно точек данных для определения отношения нормализации.

ThresholdsValue является вектором 1 на 2 [LT, HT] где LT - порог для самого низкого среднего ранга и HT - порог для наивысшего среднего ранга. Значения должны быть между 0 и 1. Значение по умолчанию - [0.05, 0.005].

StopPercentileValue

Свойство для остановки процесса итерации при достижении количества точек данных в инвариантном наборе N процент от общего числа точек данных. По умолчанию: 1.

Примечание

Если это свойство не используется, процесс итерации продолжается до тех пор, пока больше точки данных не будут удалены.

RayPercentileValue

Свойство для выбора N процент от наивысшего ранжированного инвариантного набора точек данных для соответствия прямой линии, в то время как остальные точки данных подгоняются к бегущей медианной кривой. Окончательная проходная медианная кривая представляет собой кусочно-линейную кривую. По умолчанию: 1.5.

MethodValue

Свойство для выбора метода сглаживания, используемого для нормализации данных. Войти 'lowess' или 'runmedian'. По умолчанию: 'lowess'.

ShowplotValue

Свойство для управления построением двух пар графиков рассеяния (до и после нормализации). Первая пара отображает базовые данные по сравнению с данными из указанного столбца (кристалла) из матрицы. Data. Вторая - это пара графиков рассеяния M-A, которые отображают M (отношение между базовой линией и образцом) к A (среднее от базовой линии и образца). Введите либо 'all' (график пары графиков рассеяния для каждого столбца или чипа) или укажите подмножество столбцов (чипов) путем ввода номера (ов) столбца или диапазона чисел .

Описание

NormData = affyinvarsetnorm(Data) нормализует значения в каждом столбце (кристалле) интенсивностей зонда в Data к опорной линии, используя метод инвариантного набора. NormData - матрица нормированных интенсивностей зонда из Data.

В частности, affyinvarsetnorm:

  • Выбор индекса базовой линии, обычно столбца, средняя интенсивность которого является медианой всех столбцов.

  • Для каждого столбца определяет пропорциональную разность рангов (prd) для каждой пары рангов, RureX и RureY, из столбца выборки и базовой ссылки.

    prd = abs (RureX - RureY)

  • Для каждого столбца определяет инвариантный набор точек данных, выбирая точки данных, пропорциональные разности рангов которых (prd) ниже порогового значения, которое является заданным пороговым значением для данной точки данных (определяемым ThresholdsValue свойство). Он повторяет процесс до тех пор, пока больше ни одна точка данных не будет исключена, или пока не будет достигнут заданный процент точек данных.

    Инвариантным набором являются точки данных с prd < порогом.

  • Для каждого столбца использует инвариантный набор точек данных, чтобы вычислить нижнюю или текущую кривую медианного сглаживания, которая используется для нормализации данных в этом столбце.

[NormData, MedStructure] = affyinvarsetnorm(Data) также возвращает структуру индекса столбца, выбранного в качестве базовой линии, и медианы интенсивности каждого столбца до и после нормализации.

Примечание

Если Data содержит значения NaN, затем NormData также будет содержать значения NaN в соответствующих позициях.

... affyinvarsetnorm(..., 'PropertyName', PropertyValue, ...) требования affyinvarsetnorm с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...) позволяет выбрать индекс столбца N от Data в качестве базового столбца. По умолчанию - индекс столбца, средняя интенсивность которого является медианой всех столбцов.

... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для наименьшего среднего ранга и наивысшего среднего ранга, которые используются для определения инвариантного множества. Инвариантное множество рангов - это множество точек данных, пропорциональная разность рангов которых меньше заданного порога. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга. Выберите эти два порога эмпирически, чтобы ограничить разброс инвариантного множества, но разрешить достаточно точек данных для определения отношения нормализации.

ThresholdsValue является вектором 1 на 2 [LT, HT], где LT - порог для самого низкого среднего ранга и HT - порог для наивысшего среднего ранга. Значения должны быть между 0 и 1. Значение по умолчанию - [0.05, 0.005].

... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...) останавливает процесс итерации, когда число точек данных в инвариантном наборе достигает N процент от общего числа точек данных. По умолчанию: 1.

Примечание

Если это свойство не используется, процесс итерации продолжается до тех пор, пока больше точки данных не будут удалены.

... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...) выбирает N процент от наивысшего ранжированного инвариантного набора точек данных для соответствия прямой линии, в то время как остальные точки данных подгоняются к бегущей медианной кривой. Окончательная проходная медианная кривая представляет собой кусочно-линейную кривую. По умолчанию: 1.5.

... affyinvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue является 'lowess', affyinvarsetnorm использует метод lowess. Когда MethodValue является 'runmedian', affyinvarsetnorm использует выполняющийся метод медианы. По умолчанию: 'lowess'.

... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...) строит две пары графиков рассеяния (до и после нормализации). Первая пара отображает базовые данные по сравнению с данными из указанного столбца (кристалла) из матрицы. Data. Вторая - это пара графиков рассеяния M-A, которые отображают M (отношение между базовой линией и образцом) к A (среднее от базовой линии и образца). Когда ShowplotValue является 'all', affyinvarsetnorm строит график пары графиков рассеяния для каждого столбца или чипа. Когда ShowplotValue - число (числа) или диапазон чисел ,affyinvarsetnorm строит график пары графиков рассеяния для указанных номеров столбцов (фишек).

Примеры

свернуть все

В этом примере показано, как нормализовать данные affymetrix. prostatecancerrawdata.mat файл, используемый в примере, содержит данные Best et al., 2005.

Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, который содержит переменные данных Affymetrix, включая pmMatrix матрица значений интенсивности зонда PM из нескольких файлов CEL.

load prostatecancerrawdata

Нормализуйте данные в pmMatrix и постройте график данных из столбцов (чипов) 2 и 3. Столбец 1 является базовой линией.

NormMatrix = affyinvarsetnorm(pmMatrix, 'Showplot',[2 3]);

Figure contains 4 axes. Axes 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 contains 3 objects of type line. This object represents Invariant set. Axes 3 contains 4 objects of type line. Axes 4 contains 3 objects of type line.

Figure contains 4 axes. Axes 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 contains 3 objects of type line. This object represents Invariant set. Axes 3 contains 4 objects of type line. Axes 4 contains 3 objects of type line.

Ссылки

Li, C. и Wong, W.H. (2001). Модельный анализ олигонуклеотидных массивов: валидация модели, проблемы проектирования и применение стандартных ошибок. Биология генома 2 (8): research 0032.1-0032.11.

[3] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собирается, Я., Эриксон, Х. С., Георгевич, Л., Тангреа, М. А., Дюрей, П.Х., Гонсалес, С., Веласко, А., Линехан, В.М., Матусик, Р.Дж., Прайс, Д.К., Фигг, В.Д., Эммерт-Бак, М.Р., и Чуакки, Р.Ф. (2005). Молекулярные изменения при первичном раке предстательной железы после терапии андрогенной абляцией. Клинические исследования рака 11, 6823-6834.

Представлен в R2006a