mainvarsetnorm

Выполните нормализацию набора инварианта ранга на значениях экспрессии гена от двух экспериментальных условий или фенотипов

Синтаксис

NormDataY = mainvarsetnorm(DataX, DataY)
NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...)
NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...)
NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...)
NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...)
NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...)
NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

DataX

Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных используются в качестве базовой линии.

DataY

Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных будут нормированы с помощью базовой линии.

ThresholdsValue

Вектор, который устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в DataX и DataY к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.

Примечание

Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.

ThresholdsValue вектор 1 на 2 [LT, HT], где LT порог для самого низкого среднего ранга и HT порог для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0 и 1. Значением по умолчанию является [0.03, 0.07].

ExcludeValue

Свойство отфильтровать инвариантный набор точек данных, исключением точек данных, чей средний ранг (между DataX и DataY) находится в самом высоком N оцениваемые средние значения или самый низкий N оцениваемые средние значения.

PercentileValue

Свойство остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент общего количества точек входных данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

IterateValue

Свойство управлять процессом итерации для определения инвариантного набора точек данных. Введите true чтобы не повторить процесс или до, больше точек данных не устраняется, или, предопределенный процент точек данных (PercentileValue) достигнут. Введите false выполнять только одну итерацию процесса. Значением по умолчанию является true.

Совет

Выберите false для меньших наборов данных, обычно меньше чем 200 точек данных.

MethodValue

Свойство выбрать метод сглаживания раньше нормировало данные. Введите 'lowess' или 'runmedian'. Значением по умолчанию является 'lowess'.

SpanValue

Свойство установить размер окна для метода сглаживания. Если SpanValue меньше 1, размер окна то, что процент количества точек данных. Если SpanValue равно или больше, чем 1, размер окна имеет размер SpanValue. Значением по умолчанию является 0.05, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.

ShowplotValue

Свойство управлять графическим выводом пары графиков рассеивания M-A (до и после нормализации). M является отношением между DataX и DataY. A является средним значением DataX и DataY. Введите true создать пару графиков рассеивания M-A. Значением по умолчанию является false.

Описание

NormDataY = mainvarsetnorm(DataX, DataY) нормирует значения в DataY, вектор из значений экспрессии гена, к ссылочному вектору, DataX, использование инвариантного метода установки. NormDataY вектор из нормированных значений экспрессии гена от DataY.

А именно, mainvarsetnorm:

  • Определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, от двух векторов из значений экспрессии гена, DataX и DataY.

    prd = abs (RankX - RankY)

  • Определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия в ранге которых (prd) ниже threshold, который является предопределенным порогом для точки определенных данных (заданный ThresholdsValue свойство. Это опционально повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных.

    Инвариантный набор является точками данных с prd <threshold.

  • Использует инвариантный набор точек данных, чтобы вычислить lowess или рабочую среднюю кривую сглаживания, которая используется, чтобы нормировать данные в DataY.

Примечание

Если DataX или DataY содержит значения NaN, затем NormDataY будет также содержать значения NaN в соответствующих положениях.

Совет

mainvarsetnorm полезно для исправления для смещения краски в двухцветных микроданных массива.

NormDataY = mainvarsetnorm (..., 'PropertyName', PropertyValue, ...) вызовы mainvarsetnorm с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в DataX и DataY к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.

Примечание

Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.

ThresholdsValue вектор 1 на 2 [LT, HT], где LT порог для самого низкого среднего ранга и HT порог для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0 и 1. Значением по умолчанию является [0.03, 0.07].

NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...) фильтрует инвариантный набор точек данных, исключением точек данных чей средний ранг (между DataX и DataY) находится в самом высоком N оцениваемые средние значения или самый низкий N оцениваемые средние значения.

NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...) останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент общего количества точек входных данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...) управляет процессом итерации для определения инвариантного набора точек данных. Когда IterateValue true, mainvarsetnorm повторяет процесс, пока или больше точек данных не устраняется, или предопределенный процент точек данных (PercentileValue) достигнут. Когда IterateValue false, выполняет только одну итерацию процесса. Значением по умолчанию является true.

Совет

Выберите false для меньших наборов данных, обычно меньше чем 200 точек данных.

NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue 'lowess', mainvarsetnorm использует lowess метод. Когда MethodValue 'runmedian', mainvarsetnorm использует под управлением средний метод. Значением по умолчанию является 'lowess'.

NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...) устанавливает размер окна для метода сглаживания. Если SpanValue меньше 1, размер окна то, что процент количества точек данных. Если SpanValue равно или больше, чем 1, размер окна имеет размер SpanValue. Значением по умолчанию является 0.05, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.

NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...) определяет, построить ли пару графиков рассеивания M-A (до и после нормализации). M является отношением между DataX и DataY. A является средним значением DataX и DataY. Когда ShowplotValue true, mainvarsetnorm строит графики рассеивания M-A. Значением по умолчанию является false.

Примеры

свернуть все

Этот пример иллюстрирует, как откорректировать для различий в смещении или сканировании краски между двумя каналами данных из двухцветного эксперимента микромассивов.

Считайте микроданные массива из демонстрационного файла GPR.

maStruct = gprread('mouse_a1wt.gpr');

Извлеките значения экспрессии гена из двух различных экспериментальных условий.

cy5data = magetfield(maStruct, 'F635 Median');
cy3data = magetfield(maStruct, 'F532 Median');

Нормируйте cy3data использование cy5data как ссылка и график результаты.

Normcy3data = mainvarsetnorm(cy5data, cy3data, 'showplot', true);

Figure contains 2 axes and other objects of type subplottext. Axes 1 with title Before Normalization contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 with title After Normalization contains 3 objects of type line. This object represents Invariant set.

При совершенных экспериментальных условиях точки данных с равными значениями выражения упали бы вдоль M = 0 линий, которые представляют отношение экспрессии гена 1. Однако окрасьте смещение, заставил измеренные значения в одном канале быть выше, чем другой канал, как замечено в Перед графиком нормализации. Нормализация откорректировала отклонение, как замечено в После графика нормализации.

Ссылки

[1] Цзэн, G.C., О, Min-Kyu, Rohlin, L., Ляо, J.C., и Вонг, W.H. (2001) Проблемы в анализе комплементарной ДНК микромассивов: качественная фильтрация, нормализация канала, модели изменений и оценка генных эффектов. Исследование Нуклеиновых кислот. 29, 2549-2557.

[2] Хоффман, R., Seidl, T. и Dugas, M. (2002) Сильное воздействие нормализации на обнаружении дифференцированно описанных генов в анализе микроданных массива олигонуклеотида. Биология генома. 3 (7): исследование 0033.1-0033.11.

Смотрите также

| | |

Введен в R2006a