affyinvarsetnorm

Выполните нормализацию набора инварианта ранга на тестовой интенсивности от нескольких Affymetrix CEL или Dat-файлы

Синтаксис

NormData = affyinvarsetnorm(Data)
[NormData, MedStructure] = affyinvarsetnorm(Data)
... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...)
... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...)
... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...)
... affyinvarsetnorm(..., 'Method', MethodValue, ...)
... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

Data

Матрица значений интенсивности, где каждая строка соответствует идеальной паре (PM), зонд и каждый столбец соответствуют Affymetrix® CEL или Dat-файл. (Каждый CEL или Dat-файл сгенерированы от отдельного чипа. Все микросхемы должны иметь тот же тип.)

MedStructure

Структура медианы интенсивности каждого столбца до и после нормализации и индекс столбца, выбранного в качестве базовой линии.

BaselineValue

Свойство управлять выбором индекса столбца N от Data использоваться в качестве базового столбца. Значением по умолчанию является индекс столбца, средняя интенсивность которого является медианой всех столбцов.

ThresholdsValue

Свойство установить пороги для самого низкого среднего ранга и самого высокого среднего ранга, которые используются, чтобы определить инвариантный набор. Набор инварианта ранга является набором точек данных, пропорциональное различие в ранге которых меньше, чем заданный порог. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации.

ThresholdsValue вектор 1 на 2 [LT, HT] где LT порог для самого низкого среднего ранга и HT порог для самого высокого среднего ранга. Значения должны быть между 0 и 1. Значением по умолчанию является [0.05, 0.005].

StopPercentileValue

Свойство остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент общего количества точек данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

RayPercentileValue

Свойство выбрать N процент самого высокого оцениваемого инвариантного набора точек данных, чтобы соответствовать прямой линии через, в то время как остающиеся точки данных адаптированы к рабочей средней кривой. Итоговая рабочая средняя кривая является кусочной линейной кривой. Значением по умолчанию является 1.5.

MethodValue

Свойство выбрать метод сглаживания раньше нормировало данные. Введите 'lowess' или 'runmedian'. Значением по умолчанию является 'lowess'.

ShowplotValue

Свойство управлять графическим выводом двух пар графиков рассеивания (до и после нормализации). Первая пара отображает базовые данные на графике по сравнению с данными из заданного столбца (чип) от матричного Data. Второй является пара графиков рассеивания M-A, которая строит M (отношение между базовой линией и выборкой) по сравнению с (среднее значение базовой линии и выборки). Введите любой 'all' (постройте пару графиков рассеивания для каждого столбца или чипа), или задайте подмножество столбцов (микросхемы) путем ввода номера (номеров) столбца или области значений чисел.

Описание

NormData = affyinvarsetnorm(Data) нормирует значения в каждом столбце (чип) тестовой интенсивности в Data к базовой ссылке, с помощью инвариантного метода установки. NormData матрица нормированной тестовой интенсивности от Data.

А именно, affyinvarsetnorm:

  • Выбирает базовый индекс, обычно столбец, средняя интенсивность которого является медианой всех столбцов.

  • Для каждого столбца, определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, из демонстрационного столбца и базовой ссылки.

    prd = abs (RankX - RankY)

  • Для каждого столбца, определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия в ранге которых (prd) ниже threshold, который является предопределенным порогом для точки определенных данных (заданный ThresholdsValue свойство. Это повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных.

    Инвариантный набор является точками данных с prd <threshold.

  • Для каждого столбца, использует инвариантный набор точек данных, чтобы вычислить lowess или рабочую среднюю кривую сглаживания, которая используется, чтобы нормировать данные в том столбце.

[NormData, MedStructure] = affyinvarsetnorm(Data) также возвращает структуру индекса столбца, выбранного в качестве базовой линии и медианы интенсивности каждого столбца до и после нормализации.

Примечание

Если Data содержит значения NaN, затем NormData будет также содержать значения NaN в соответствующих положениях.

... affyinvarsetnorm (..., 'PropertyName', PropertyValue, ...) вызовы affyinvarsetnorm с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

... affyinvarsetnorm(..., 'Baseline', BaselineValue, ...) позволяет вам выбрать индекс столбца N от Data быть базовым столбцом. Значением по умолчанию является индекс столбца, средняя интенсивность которого является медианой всех столбцов.

... affyinvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга, которые используются, чтобы определить инвариантный набор. Набор инварианта ранга является набором точек данных, пропорциональное различие в ранге которых меньше, чем заданный порог. Порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации.

ThresholdsValue вектор 1 на 2 [LT, HT], где LT порог для самого низкого среднего ранга и HT порог для самого высокого среднего ранга. Значения должны быть между 0 и 1. Значением по умолчанию является [0.05, 0.005].

... affyinvarsetnorm(..., 'StopPercentile', StopPercentileValue, ...) останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент общего количества точек данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

... affyinvarsetnorm(..., 'RayPercentile', RayPercentileValue, ...) выбирает N процент самого высокого оцениваемого инвариантного набора точек данных, чтобы соответствовать прямой линии через, в то время как остающиеся точки данных адаптированы к рабочей средней кривой. Итоговая рабочая средняя кривая является кусочной линейной кривой. Значением по умолчанию является 1.5.

... affyinvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue 'lowess', affyinvarsetnorm использует lowess метод. Когда MethodValue 'runmedian', affyinvarsetnorm использует под управлением средний метод. Значением по умолчанию является 'lowess'.

... affyinvarsetnorm(..., 'Showplot', ShowplotValue, ...) графики две пары графиков рассеивания (до и после нормализации). Первая пара отображает базовые данные на графике по сравнению с данными из заданного столбца (чип) от матричного Data. Второй является пара графиков рассеивания M-A, которая строит M (отношение между базовой линией и выборкой) по сравнению с (среднее значение базовой линии и выборки). Когда ShowplotValue 'all', affyinvarsetnorm строит пару графиков рассеивания для каждого столбца или чипа. Когда ShowplotValue номер (номера) или область значений чисел, affyinvarsetnorm строит пару графиков рассеивания для обозначенных номеров столбцов (микросхемы).

Примеры

свернуть все

В этом примере показано, как нормировать affymetrix данные. prostatecancerrawdata.mat файл, используемый в примере, содержит данные из Лучшего и др., 2005.

Загрузите MAT-файл, включенный с программным обеспечением Bioinformatics Toolbox™, которое содержит переменные данных Affymetrix, включая pmMatrix , матрица PM зондирует значения интенсивности из нескольких файлов CEL.

load prostatecancerrawdata

Нормируйте данные в pmMatrix и отобразите данные на графике из столбцов (микросхемы) 2 и 3. Столбец 1 является базовой линией.

NormMatrix = affyinvarsetnorm(pmMatrix, 'Showplot',[2 3]);

Figure contains 4 axes objects. Axes object 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes object 2 contains 3 objects of type line. This object represents Invariant set. Axes object 3 contains 4 objects of type line. Axes object 4 contains 3 objects of type line.

Figure contains 4 axes objects. Axes object 1 contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes object 2 contains 3 objects of type line. This object represents Invariant set. Axes object 3 contains 4 objects of type line. Axes object 4 contains 3 objects of type line.

Ссылки

[1] Литий, C., и Вонг, W.H. (2001). Основанный на модели анализ массивов олигонуклеотида: проверка допустимости модели, проблемы проекта и приложение стандартной погрешности. Биология генома 2 (8): research0032.1-0032.11.

[3] Лучше всего, C.J.M., Гиллеспи, J.W., И, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Эриксон, H.S., Георгевич, L., Tangrea, M.A., Duray, P.H., Гонсалес, S., Веласко, A., Linehan, W.M., Matusik, R.J., Цена, D.K., Figg, W.D., Emmert-маркер, M.R., и Chuaqui, R.F. (2005). Молекулярные изменения при первичном раке простаты после терапии абляции андрогена. Клинические Исследования рака 11, 6823–6834.

Введен в R2006a