Выполните нормализацию набора инварианта ранга на значениях экспрессии гена от двух экспериментальных условий или фенотипов
NormDataY
=
mainvarsetnorm(DataX, DataY
)
NormDataY
=
mainvarsetnorm(..., 'Thresholds', ThresholdsValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Exclude', ExcludeValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Percentile', PercentileValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Iterate', IterateValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Method', MethodValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Span', SpanValue
,
...)
NormDataY
=
mainvarsetnorm(..., 'Showplot', ShowplotValue
,
...)
DataX | Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных используются в качестве базовой линии. |
DataY | Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных будут нормированы с помощью базовой линии. |
ThresholdsValue | Вектор, который устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в Примечание Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.
|
ExcludeValue | Свойство отфильтровать инвариантный набор точек данных, исключением точек данных, чей средний ранг (между |
PercentileValue | Свойство остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает Примечание Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.
|
IterateValue | Свойство управлять процессом итерации для определения инвариантного набора точек данных. Введите Совет Выберите
|
MethodValue | Свойство выбрать метод сглаживания раньше нормировало данные. Введите |
SpanValue | Свойство установить размер окна для метода сглаживания. Если |
ShowplotValue | Свойство управлять графическим выводом пары графиков рассеивания M-A (до и после нормализации). M является отношением между |
нормирует значения в NormDataY
=
mainvarsetnorm(DataX, DataY
)DataY
, вектор из значений экспрессии гена, к ссылочному вектору, DataX
, использование инвариантного метода установки. NormDataY
вектор из нормированных значений экспрессии гена от DataY
.
А именно, mainvarsetnorm
:
Определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, от двух векторов из значений экспрессии гена, DataX
и DataY
.
prd = abs (RankX - RankY)
Определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия в ранге которых (prd) ниже threshold, который является предопределенным порогом для точки определенных данных (заданный ThresholdsValue
свойство. Это опционально повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных.
Инвариантный набор является точками данных с prd <threshold.
Использует инвариантный набор точек данных, чтобы вычислить lowess или рабочую среднюю кривую сглаживания, которая используется, чтобы нормировать данные в DataY
.
Примечание
Если DataX
или DataY
содержит значения NaN, затем NormDataY
будет также содержать значения NaN в соответствующих положениях.
Совет
mainvarsetnorm
полезно для исправления для смещения краски в двухцветных микроданных массива.
вызовы NormDataY
= mainvarsetnorm (..., 'PropertyName
', PropertyValue
, ...)mainvarsetnorm
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в NormDataY
=
mainvarsetnorm(..., 'Thresholds', ThresholdsValue
,
...)DataX
и DataY
к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.
Примечание
Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.
ThresholdsValue
вектор 1 на 2 [LT, HT
], где LT
порог для самого низкого среднего ранга и HT
порог для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0
и 1
. Значением по умолчанию является [0.03, 0.07
].
фильтрует инвариантный набор точек данных, исключением точек данных чей средний ранг (между NormDataY
=
mainvarsetnorm(..., 'Exclude', ExcludeValue
,
...)DataX
и DataY
) находится в самом высоком N
оцениваемые средние значения или самый низкий N
оцениваемые средние значения.
останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает NormDataY
=
mainvarsetnorm(..., 'Percentile', PercentileValue
,
...)N
процент общего количества точек входных данных. Значением по умолчанию является 1
.
Примечание
Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.
управляет процессом итерации для определения инвариантного набора точек данных. Когда NormDataY
=
mainvarsetnorm(..., 'Iterate', IterateValue
,
...)IterateValue
true
, mainvarsetnorm
повторяет процесс, пока или больше точек данных не устраняется, или предопределенный процент точек данных (PercentileValue
) достигнут. Когда IterateValue
false
, выполняет только одну итерацию процесса. Значением по умолчанию является true
.
Совет
Выберите false
для меньших наборов данных, обычно меньше чем 200 точек данных.
выбирает метод сглаживания для нормализации данных. Когда NormDataY
=
mainvarsetnorm(..., 'Method', MethodValue
,
...)MethodValue
'lowess'
, mainvarsetnorm
использует lowess метод. Когда MethodValue
'runmedian'
, mainvarsetnorm
использует под управлением средний метод. Значением по умолчанию является 'lowess'
.
устанавливает размер окна для метода сглаживания. Если NormDataY
=
mainvarsetnorm(..., 'Span', SpanValue
,
...)SpanValue
меньше 1, размер окна то, что процент количества точек данных. Если SpanValue
равно или больше, чем 1, размер окна имеет размер SpanValue
. Значением по умолчанию является 0.05
, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.
определяет, построить ли пару графиков рассеивания M-A (до и после нормализации). M является отношением между NormDataY
=
mainvarsetnorm(..., 'Showplot', ShowplotValue
,
...)DataX
и DataY
. A является средним значением DataX
и DataY
. Когда ShowplotValue
true
, mainvarsetnorm
строит графики рассеивания M-A. Значением по умолчанию является false
.
[1] Цзэн, G.C., О, Min-Kyu, Rohlin, L., Ляо, J.C., и Вонг, W.H. (2001) Проблемы в анализе комплементарной ДНК микромассивов: качественная фильтрация, нормализация канала, модели изменений и оценка генных эффектов. Исследование Нуклеиновых кислот. 29, 2549-2557.
[2] Хоффман, R., Seidl, T. и Dugas, M. (2002) Сильное воздействие нормализации на обнаружении дифференцированно описанных генов в анализе микроданных массива олигонуклеотида. Биология генома. 3 (7): исследование 0033.1-0033.11.