affyinvarsetnorm

Выполните нормализацию инвариантного набора рангов при интенсивности зонда из нескольких файлов Affymetrix CEL или DAT

Синтаксис

NormData = affyinvarsetnorm(Data)
[NormData, MedStructure] = affyinvarsetnorm(Data)
... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...)
... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...)
... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...)
... affyinvarsetnorm(..., 'Method', MethodValue, ...)
... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

Data

Матрица значений интенсивности, где каждая строка соответствует зонду совершенного соответствия (PM), и каждый столбец соответствует Affymetrix® Файл CEL или DAT. (Каждый файл CEL или DAT генерируется из отдельного чипа. Все чипы должны быть одного типа.)

MedStructure

Структура медианы интенсивности каждого столбца до и после нормализации и индекс столбца, выбранного в качестве базовой линии.

BaselineValue

Свойство для управления выбором индекса столбца N от Data для использования в качестве базового столбца. По умолчанию это индекс столбца, медианная интенсивность которого является медианой всех столбцов.

ThresholdsValue

Свойство устанавливать пороги для самого низкого среднего ранга и самого высокого среднего ранга, которые используются для определения инвариантного набора. Набор инвариантов ранга является набором точек данных, пропорциональное различие рангов которых меньше заданного порога. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порога для самого высокого среднего ранга. Выберите эти два порога эмпирически, чтобы ограничить распространение инвариантного множества, но разрешить достаточное количество точек данных, чтобы определить отношения нормализации.

ThresholdsValue вектор 1 на 2 [LT, HT] где LT - порог наименьшего среднего ранга и HT - порог для наивысшего среднего ранга. Значения должны быть между 0 и 1. По умолчанию это [0.05, 0.005].

StopPercentileValue

Свойство, чтобы остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент от общего количества точек данных. По умолчанию это 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше не будут удалены точки данных.

RayPercentileValue

Свойство для выбора N процент наивысшего ранжированного инвариантного набора точек данных для соответствия прямой линии, в то время как остальные точки данных подгоняются к бегущей медианной кривой. Конечная срединная кривая является кусочно-линейной кривой. По умолчанию это 1.5.

MethodValue

Свойство для выбора метода сглаживания, используемого для нормализации данных. Введите 'lowess' или 'runmedian'. По умолчанию это 'lowess'.

ShowplotValue

Свойство для управления графического изображения двух пар графиков поля точек (до и после нормализации). Первая пара строит графики базовых данных по сравнению с данными из заданного столбца (чипа) из матрицы Data. Второй является парой графиков поля точек M-A, которая строит графики M (отношение между базовой линией и выборкой) против A (среднее значение базовой линии и выборки). Введите любой из 'all' (постройте пару графиков поля точек для каждого столбца или фишки) или укажите подмножество столбцов (фишек) путем ввода номера столбца или области значений чисел .

Описание

NormData = affyinvarsetnorm(Data) нормирует значения в каждом столбце (чипе) интенсивности зонда в Data к опорной ссылке, с использованием метода инвариантного набора. NormData - матрица нормированной интенсивности зонда из Data.

В частности, affyinvarsetnorm:

  • Выбирает базовый индекс, обычно столбец, медианная интенсивность которого является медианой всех столбцов.

  • Для каждого столбца определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, из столбца выборки и опорной линии.

    prd = abs (RankX - RankY)

  • Для каждого столбца определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия рангов которых (prd) ниже threshold, что является предопределенным порогом для заданной точки данных (заданным ThresholdsValue свойство). Он повторяет процесс, пока больше не будут удалены точки данных или не будет достигнут предопределенный процент точек данных.

    Инвариантным множеством являются точки данных с prd < threshold.

  • Для каждого столбца использует инвариантный набор точек данных, чтобы вычислить нижнюю или текущую среднюю кривую сглаживания, которая используется для нормализации данных в этом столбце.

[NormData, MedStructure] = affyinvarsetnorm(Data) также возвращает структуру индекса столбца, выбранного в качестве базовой линии, и медианы интенсивности каждого столбца до и после нормализации.

Примечание

Если Data содержит значения NaN, затем NormData будет также содержать значения NaN в соответствующих положениях.

... affyinvarsetnorm (..., 'PropertyName', PropertyValue, ...) вызывает affyinvarsetnorm с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...) позволяет выбрать индекс столбца N от Data чтобы быть базовым столбцом. По умолчанию это индекс столбца, медианная интенсивность которого является медианой всех столбцов.

... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга, которые используются для определения инвариантного набора. Набор инвариантов ранга является набором точек данных, пропорциональное различие рангов которых меньше заданного порога. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порога для самого высокого среднего ранга. Выберите эти два порога эмпирически, чтобы ограничить распространение инвариантного множества, но разрешить достаточное количество точек данных, чтобы определить отношения нормализации.

ThresholdsValue вектор 1 на 2 [LT, HT], где LT - порог наименьшего среднего ранга и HT - порог для наивысшего среднего ранга. Значения должны быть между 0 и 1. По умолчанию это [0.05, 0.005].

... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...) останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент от общего количества точек данных. По умолчанию это 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше не будут удалены точки данных.

... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...) выбирает N процент наивысшего ранжированного инвариантного набора точек данных для соответствия прямой линии, в то время как остальные точки данных подгоняются к бегущей медианной кривой. Конечная срединная кривая является кусочно-линейной кривой. По умолчанию это 1.5.

... affyinvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue является 'lowess', affyinvarsetnorm использует метод lowess. Когда MethodValue является 'runmedian', affyinvarsetnorm использует текущий медианный метод. По умолчанию это 'lowess'.

... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...) строит графики двух пар графиков поля точек (до и после нормализации). Первая пара строит графики базовых данных по сравнению с данными из заданного столбца (чипа) из матрицы Data. Второй является парой графиков поля точек M-A, которая строит графики M (отношение между базовой линией и выборкой) против A (среднее значение базовой линии и выборки). Когда ShowplotValue является 'all', affyinvarsetnorm Строит пару графиков поля точек для каждого столбца или чипа. Когда ShowplotValue - число или область значений чисел, affyinvarsetnorm Строит пару графиков поля точек для указанных номеров столбцов (фишек).

Примеры

свернуть все

Этот пример показывает, как нормализовать данные affymetrix. The prostatecancerrawdata.mat файл, используемый в примере, содержит данные Best et al., 2005.

Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, которое содержит переменные данных Affymetrix, включая pmMatrix , матрица значений интенсивности пробы PM из нескольких файлов CEL.

load prostatecancerrawdata

Нормализуйте данные в pmMatrix и постройте график данных из столбцов (фишек) 2 и 3. Столбец 1 является базовой линией.

NormMatrix = affyinvarsetnorm(pmMatrix, 'Showplot',[2 3]);

Figure contains 4 axes. Axes 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 contains 3 objects of type line. This object represents Invariant set. Axes 3 contains 4 objects of type line. Axes 4 contains 3 objects of type line.

Figure contains 4 axes. Axes 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 contains 3 objects of type line. This object represents Invariant set. Axes 3 contains 4 objects of type line. Axes 4 contains 3 objects of type line.

Ссылки

[1] Li, C. и Wong, W.H. (2001). Основанный на модели анализ олигонуклеотидных массивов: валидация моделипроблем проекта и стандартное применение ошибок. Биология генома 2 (8): research0032.1-0032.11.

[3] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собери, Я., Эриксон, Х.С., Георгиевич, Л., Тангрея, М.А., Duray, P.H., Gonsalez, S., Velasco, A., Linehan, W.M., Matusik, R.J., Price, D.K., Figg, W.D., Emmert-Buck, M.R., and Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке предстательной железы после андрогенной абляции. Клинические исследования рака 11, 6823-6834.

Введенный в R2006a