Выполнить нормализацию рангового инвариантного набора по значениям экспрессии генов из двух экспериментальных условий или фенотипов
NormDataY = mainvarsetnorm(DataX, DataY)
NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...)
NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...)
NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...)
NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...)
NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...)
NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...)
DataX | Вектор значений экспрессии гена из одного экспериментального состояния или фенотипа, где каждый ряд соответствует гену. Эти точки данных используются в качестве базовой линии. |
DataY | Вектор значений экспрессии гена из одного экспериментального состояния или фенотипа, где каждый ряд соответствует гену. Эти точки данных нормализуются с использованием базовой линии. |
ThresholdsValue | Вектор, устанавливающий пороги для наименьшего среднего ранга и наивысшего среднего ранга между двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в Примечание Эти индивидуальные пороги используются для определения инвариантного множества рангов, которое представляет собой множество точек данных, каждая из которых имеет пропорциональную разность рангов (prd), меньшую, чем ее заданный порог. Дополнительные сведения о наборе инвариантов рангов см. в разделе Описание.
|
ExcludeValue | Свойство для фильтрации инвариантного набора точек данных путем исключения точек данных, средний ранг которых (между |
PercentileValue | Свойство для остановки процесса итерации при достижении количества точек данных в инвариантном наборе Примечание Если это свойство не используется, процесс итерации продолжается до тех пор, пока больше точки данных не будут удалены.
|
IterateValue | Свойство для управления процессом итерации для определения инвариантного набора точек данных. Войти Совет Выбрать
|
MethodValue | Свойство для выбора метода сглаживания, используемого для нормализации данных. Войти |
SpanValue | Свойство для задания размера окна для метода сглаживания. Если |
ShowplotValue | Свойство для управления графиком пары графиков рассеяния M-A (до и после нормализации). M - отношение между |
нормализует значения в NormDataY = mainvarsetnorm(DataX, DataY)DataYвектор значений экспрессии генов к опорному вектору, DataX, используя метод инвариантного набора. NormDataY является вектором нормализованных значений экспрессии генов из DataY.
В частности, mainvarsetnorm:
Определяет пропорциональную разницу рангов (prd) для каждой пары рангов, RureX и RureY, из двух векторов значений экспрессии генов, DataX и DataY.
prd = abs (RureX - RureY)
Определяет инвариантный набор точек данных, выбирая точки данных, пропорциональные разности рангов которых (prd) ниже порогового значения, которое является заданным пороговым значением для данной точки данных (определяемым ThresholdsValue свойство). Он необязательно повторяет процесс до тех пор, пока не будет устранено больше точек данных или не будет достигнут заданный процент точек данных.
Инвариантным набором являются точки данных с prd < порогом.
Использует инвариантный набор точек данных для вычисления кривой сглаживания с низкой или текущей средней величиной, которая используется для нормализации данных в DataY.
Примечание
Если DataX или DataY содержит значения NaN, затем NormDataY также будет содержать значения NaN в соответствующих позициях.
Совет
mainvarsetnorm полезен для коррекции смещения красителя в данных двухцветных микрочипов.
требования NormDataY = mainvarsetnorm(..., 'PropertyName', PropertyValue, ...)mainvarsetnorm с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)DataX и DataY до рангов, затем усреднение двух рангов для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.
Примечание
Эти индивидуальные пороги используются для определения инвариантного множества рангов, которое представляет собой множество точек данных, каждая из которых имеет пропорциональную разность рангов (prd), меньшую, чем ее заданный порог. Дополнительные сведения о наборе инвариантов рангов см. в разделе Описание.
ThresholdsValue является вектором 1 на 2 [LT, HT], где LT - порог для самого низкого среднего ранга и HT - порог для наивысшего среднего ранга. Выберите эти два порога эмпирически, чтобы ограничить разброс инвариантного множества, но разрешить достаточно точек данных для определения отношения нормализации. Значения должны быть между 0 и 1. Значение по умолчанию - [0.03, 0.07].
фильтрует инвариантный набор точек данных путем исключения точек данных, средний ранг которых (между NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...)DataX и DataY) находится в самом высоком N ранжированные средние или самые низкие N ранжированные средние значения.
останавливает процесс итерации, когда число точек данных в инвариантном наборе достигает NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...)N процент от общего количества входных точек данных. По умолчанию: 1.
Примечание
Если это свойство не используется, процесс итерации продолжается до тех пор, пока больше точки данных не будут удалены.
управляет процессом итерации для определения инвариантного набора точек данных. Когда NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...)IterateValue является true, mainvarsetnorm повторяет процесс до тех пор, пока больше ни одна точка данных не будет исключена, или пока не будет определен процент точек данных (PercentileValue) достигнут. Когда IterateValue является false, выполняет только одну итерацию процесса. По умолчанию: true.
Совет
Выбрать false для небольших наборов данных, обычно менее 200 точек данных.
выбирает метод сглаживания для нормализации данных. Когда NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...)MethodValue является 'lowess', mainvarsetnorm использует метод lowess. Когда MethodValue является 'runmedian', mainvarsetnorm использует выполняющийся метод медианы. По умолчанию: 'lowess'.
задает размер окна для метода сглаживания. Если NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...)SpanValue меньше 1, размер окна - это процент от числа точек данных. Если SpanValue равно или больше 1, размер окна - SpanValue. По умолчанию: 0.05, что соответствует размеру окна, равному 5% от общего числа точек данных в инвариантном множестве.
определяет необходимость построения графика пары M-A графиков рассеяния (до и после нормализации). M - отношение между NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...)DataX и DataY. A - среднее значение DataX и DataY. Когда ShowplotValue является true, mainvarsetnorm строит графики рассеяния M-A. По умолчанию: false.
[1] Tseng, G.C., Oh, Min-Kyu, Rohlin, L., Liao, J.C., и Wong, W.H. (2001) Вопросы анализа микрочипов кДНК: фильтрация качества, нормализация каналов, модели вариаций и оценка эффектов генов. Исследование нуклеиновых кислот. 29, 2549-2557.
[2] Гофман, Р., Зайдль, Т. и Дугас, М. (2002) Глубокое влияние нормализации на обнаружение дифференциально экспрессируемых генов в анализе данных олигонуклеотидных микрочипов. Биология генома. 3 (7): исследование 0033.1-0033.11 .