mainvarsetnorm

Выполните нормализацию набора инварианта ранга на значениях экспрессии гена от двух экспериментальных условий или фенотипов

Синтаксис

NormDataY = mainvarsetnorm(DataX, DataY)
NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...)
NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...)
NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...)
NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...)
NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...)
NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...)
NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

DataX

Вектор значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных используются в качестве базовой линии.

DataY

Вектор значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных будут нормированы с помощью базовой линии.

ThresholdsValue

Вектор, который устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в DataX и DataY к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.

Примечание

Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.

ThresholdsValue 1 2 вектор [LT, HT], где LT является порогом для самого низкого среднего ранга, и HT является порогом для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0 и 1. Значение по умолчанию [0.03, 0.07].

ExcludeValue

Свойство отфильтровать инвариантный набор точек данных, исключением точек данных, средний ранг которых (между DataX и DataY) находится в самом высоком N, оценило средние значения, или самый низкий N оценил средние значения.

PercentileValue

Свойство остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает процента N общего количества точек входных данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

IterateValue

Свойство управлять процессом итерации для определения инвариантного набора точек данных. Введите true, чтобы повторить процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных (PercentileValue). Введите false, чтобы выполнить только одну итерацию процесса. Значением по умолчанию является true.

Совет

Выберите false для меньших наборов данных, обычно меньше чем 200 точек данных.

MethodValue

Свойство выбрать метод сглаживания раньше нормировало данные. Введите 'lowess' или 'runmedian'. Значением по умолчанию является 'lowess'.

SpanValue

Свойство установить размер окна для метода сглаживания. Если SpanValue - меньше чем 1, размер окна то, что процент количества точек данных. Если SpanValue равен или больше, чем 1, размер окна имеет размер SpanValue. Значением по умолчанию является 0.05, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.

ShowplotValue

Свойство управлять графическим выводом пары графиков рассеивания M-A (до и после нормализации). M является отношением между DataX и DataY. A является средним значением DataX и DataY. Введите true, чтобы создать пару графиков рассеивания M-A. Значением по умолчанию является false.

Описание

NormDataY = mainvarsetnorm(DataX, DataY) нормирует значения в DataY, векторе значений экспрессии гена, к ссылочному вектору, DataX, с помощью инвариантного метода установки. NormDataY является вектором нормированных значений экспрессии гена от DataY.

А именно, mainvarsetnorm:

  • Определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, от двух векторов значений экспрессии гена, DataX и DataY.

    prd = abs (RankX - RankY)

  • Определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия в ранге которых (prd) ниже threshold, который является предопределенным порогом для точки определенных данных (заданный свойством ThresholdsValue). Это опционально повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных.

    Инвариантный набор является точками данных с prd <threshold.

  • Использует инвариантный набор точек данных, чтобы вычислить lowess или рабочую среднюю кривую сглаживания, которая используется, чтобы нормировать данные в DataY.

Примечание

Если DataX или DataY будут содержать значения NaN, то NormDataY будет также содержать значения NaN в соответствующих положениях.

Совет

mainvarsetnorm полезен для исправления для смещения краски в двухцветных микроданных массива.

NormDataY = mainvarsetnorm(..., 'PropertyName', PropertyValue, ...) вызывает mainvarsetnorm с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в DataX и DataY к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.

Примечание

Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.

ThresholdsValue 1 2 вектор [LT, HT], где LT является порогом для самого низкого среднего ранга, и HT является порогом для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0 и 1. Значение по умолчанию [0.03, 0.07].

NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...) фильтрует инвариантный набор точек данных, исключением точек данных, средний ранг которых (между DataX и DataY) находится в оцениваемых средних значениях самого высокого N, или самый низкий N оценил средние значения.

NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...) останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает процента N общего количества точек входных данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...) управляет процессом итерации для определения инвариантного набора точек данных. Когда IterateValue является true, mainvarsetnorm повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных (PercentileValue). То, когда IterateValue является false, выполняет только одну итерацию процесса. Значением по умолчанию является true.

Совет

Выберите false для меньших наборов данных, обычно меньше чем 200 точек данных.

NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue является 'lowess', mainvarsetnorm использует lowess метод. Когда MethodValue является 'runmedian', mainvarsetnorm использует под управлением средний метод. Значением по умолчанию является 'lowess'.

NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...) устанавливает размер окна для метода сглаживания. Если SpanValue - меньше чем 1, размер окна то, что процент количества точек данных. Если SpanValue равен или больше, чем 1, размер окна имеет размер SpanValue. Значением по умолчанию является 0.05, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.

NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...) определяет, построить ли пару графиков рассеивания M-A (до и после нормализации). M является отношением между DataX и DataY. A является средним значением DataX и DataY. Когда ShowplotValue является true, mainvarsetnorm строит графики рассеивания M-A. Значением по умолчанию является false.

Примеры

свернуть все

Этот пример иллюстрирует, как исправить для различий в смещении или сканировании краски между двумя каналами данных из двухцветного эксперимента микромассивов.

Считайте микроданные массива из демонстрационного файла GPR.

maStruct = gprread('mouse_a1wt.gpr');

Извлеките значения экспрессии гена от двух различных экспериментальных условий.

cy5data = magetfield(maStruct, 'F635 Median');
cy3data = magetfield(maStruct, 'F532 Median');

Нормируйте cy3data с помощью cy5data в качестве ссылки и постройте результаты.

Normcy3data = mainvarsetnorm(cy5data, cy3data, 'showplot', true);

При совершенных экспериментальных условиях точки данных с равными значениями выражения упали бы вдоль M = 0 строк, которые представляют отношение экспрессии гена 1. Однако окрасьте смещение, заставил измеренные значения в одном канале быть выше, чем другой канал, как замечено в Перед графиком нормализации. Нормализация исправила отклонение, как замечено в После графика нормализации.

Ссылки

[1] Цзэн, G.C., О, Min-Kyu, Rohlin, L., Ляо, J.C., и Вонг, W.H. (2001) Проблемы в анализе комплементарной ДНК микромассивов: качественная фильтрация, нормализация канала, модели изменений и оценка генных эффектов. Исследование Нуклеиновых кислот. 29, 2549-2557.

[2] Хоффман, R., Seidl, T. и Dugas, M. (2002) Сильное воздействие нормализации на обнаружении дифференцированно выраженных генов в анализе микроданных массива олигонуклеотида. Биология генома. 3 (7): исследование 0033.1-0033.11.

Смотрите также

| | |

Представленный в R2006a