mainvarsetnorm

Выполните нормализацию набора инварианта ранга на значениях экспрессии гена от двух экспериментальных условий или фенотипов

свернуть все на странице

Синтаксис

NormDataY = mainvarsetnorm(DataX, DataY) NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...) NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...) NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...) NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...) NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...) NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...)

Аргументы

`DataX`	Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных используются в качестве базовой линии.
`DataY`	Вектор из значений экспрессии гена от одного экспериментального условия или фенотипа, где каждая строка соответствует гену. Эти точки данных будут нормированы с помощью базовой линии.
`ThresholdsValue`	Вектор, который устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в `DataX` и `DataY` к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга. Примечание Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание. `ThresholdsValue` вектор 1 на 2 [`LT, HT`], где `LT` порог для самого низкого среднего ранга и `HT` порог для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между `0` и `1`. Значением по умолчанию является [`0.03, 0.07`].
`ExcludeValue`	Свойство отфильтровать инвариантный набор точек данных, исключением точек данных, чей средний ранг (между `DataX` и `DataY`) находится в самом высоком `N` оцениваемые средние значения или самый низкий `N` оцениваемые средние значения.
`PercentileValue`	Свойство остановить процесс итерации, когда количество точек данных в инвариантном наборе достигает `N` процент общего количества точек входных данных. Значением по умолчанию является `1`. Примечание Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.
`IterateValue`	Свойство управлять процессом итерации для определения инвариантного набора точек данных. Введите `true` чтобы не повторить процесс или до, больше точек данных не устраняется, или, предопределенный процент точек данных (`PercentileValue`) достигнут. Введите `false` выполнять только одну итерацию процесса. Значением по умолчанию является `true`. Совет Выберите `false` для меньших наборов данных, обычно меньше чем 200 точек данных.
`MethodValue`	Свойство выбрать метод сглаживания раньше нормировало данные. Введите `'lowess'` или `'runmedian'`. Значением по умолчанию является `'lowess'`.
`SpanValue`	Свойство установить размер окна для метода сглаживания. Если `SpanValue` меньше 1, размер окна то, что процент количества точек данных. Если `SpanValue` равно или больше, чем 1, размер окна имеет размер `SpanValue`. Значением по умолчанию является `0.05`, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.
`ShowplotValue`	Свойство управлять графическим выводом пары графиков рассеивания M-A (до и после нормализации). M является отношением между `DataX` и `DataY`. A является средним значением `DataX` и `DataY`. Введите `true` создать пару графиков рассеивания M-A. Значением по умолчанию является `false`.

Описание

NormDataY = mainvarsetnorm(DataX, DataY) нормирует значения в DataY, вектор из значений экспрессии гена, к ссылочному вектору, DataX, использование инвариантного метода установки. NormDataY вектор из нормированных значений экспрессии гена от DataY.

А именно, mainvarsetnorm:

Определяет пропорциональное различие в ранге (prd) для каждой пары рангов, RankX и RankY, от двух векторов из значений экспрессии гена, DataX и DataY.
prd = abs (RankX - RankY)
Определяет инвариантный набор точек данных путем выбора точек данных, пропорциональные различия в ранге которых (prd) ниже threshold, который является предопределенным порогом для точки определенных данных (заданный ThresholdsValue свойство. Это опционально повторяет процесс, пока или больше точек данных не устраняется, или достигнут предопределенный процент точек данных.
Инвариантный набор является точками данных с prd <threshold.
Использует инвариантный набор точек данных, чтобы вычислить lowess или рабочую среднюю кривую сглаживания, которая используется, чтобы нормировать данные в DataY.

Примечание

Если DataX или DataY содержит значения NaN, затем NormDataY будет также содержать значения NaN в соответствующих положениях.

Совет

mainvarsetnorm полезно для исправления для смещения краски в двухцветных микроданных массива.

NormDataY = mainvarsetnorm (..., 'PropertyName', PropertyValue, ...) вызовы mainvarsetnorm с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

NormDataY = mainvarsetnorm(..., 'Thresholds', ThresholdsValue, ...) устанавливает пороги для самого низкого среднего ранга и самого высокого среднего ранга между этими двумя наборами данных. Средний ранг для каждой точки данных определяется первым преобразованием значений в DataX и DataY к рангам, затем составляя в среднем два ранга для каждой точки данных. Затем порог для каждой точки данных определяется путем интерполяции между порогом для самого низкого среднего ранга и порогом для самого высокого среднего ранга.

Примечание

Эти отдельные пороги используются, чтобы определить набор инварианта ранга, который является набором точек данных, каждый имеющий пропорциональное различие в ранге (prd) меньший, чем его предопределенный порог. Для получения дополнительной информации о наборе инварианта ранга см. Описание.

ThresholdsValue вектор 1 на 2 [LT, HT], где LT порог для самого низкого среднего ранга и HT порог для самого высокого среднего ранга. Выберите эти два порога опытным путем, чтобы ограничить распространение инвариантного набора, но позволить достаточным точкам данных определять отношение нормализации. Значения должны быть между 0 и 1. Значением по умолчанию является [0.03, 0.07].

NormDataY = mainvarsetnorm(..., 'Exclude', ExcludeValue, ...) фильтрует инвариантный набор точек данных, исключением точек данных чей средний ранг (между DataX и DataY) находится в самом высоком N оцениваемые средние значения или самый низкий N оцениваемые средние значения.

NormDataY = mainvarsetnorm(..., 'Percentile', PercentileValue, ...) останавливает процесс итерации, когда количество точек данных в инвариантном наборе достигает N процент общего количества точек входных данных. Значением по умолчанию является 1.

Примечание

Если вы не используете это свойство, процесс итерации продолжается, пока больше точек данных не устраняется.

NormDataY = mainvarsetnorm(..., 'Iterate', IterateValue, ...) управляет процессом итерации для определения инвариантного набора точек данных. Когда IterateValue true, mainvarsetnorm повторяет процесс, пока или больше точек данных не устраняется, или предопределенный процент точек данных (PercentileValue) достигнут. Когда IterateValue false, выполняет только одну итерацию процесса. Значением по умолчанию является true.

Совет

Выберите false для меньших наборов данных, обычно меньше чем 200 точек данных.

NormDataY = mainvarsetnorm(..., 'Method', MethodValue, ...) выбирает метод сглаживания для нормализации данных. Когда MethodValue 'lowess', mainvarsetnorm использует lowess метод. Когда MethodValue 'runmedian', mainvarsetnorm использует под управлением средний метод. Значением по умолчанию является 'lowess'.

NormDataY = mainvarsetnorm(..., 'Span', SpanValue, ...) устанавливает размер окна для метода сглаживания. Если SpanValue меньше 1, размер окна то, что процент количества точек данных. Если SpanValue равно или больше, чем 1, размер окна имеет размер SpanValue. Значением по умолчанию является 0.05, который соответствует размеру окна, равному 5% общего количества точек данных в инвариантном наборе.

NormDataY = mainvarsetnorm(..., 'Showplot', ShowplotValue, ...) определяет, построить ли пару графиков рассеивания M-A (до и после нормализации). M является отношением между DataX и DataY. A является средним значением DataX и DataY. Когда ShowplotValue true, mainvarsetnorm строит графики рассеивания M-A. Значением по умолчанию является false.

Примеры

свернуть все

Нормируйте микроданные массива

Скрипт Open Live Script

Этот пример иллюстрирует, как откорректировать для различий в смещении или сканировании краски между двумя каналами данных из двухцветного эксперимента микромассивов.

Считайте микроданные массива из демонстрационного файла GPR.

maStruct = gprread('mouse_a1wt.gpr');

Извлеките значения экспрессии гена из двух различных экспериментальных условий.

cy5data = magetfield(maStruct, 'F635 Median');
cy3data = magetfield(maStruct, 'F532 Median');

Нормируйте cy3data использование cy5data как ссылка и график результаты.

Normcy3data = mainvarsetnorm(cy5data, cy3data, 'showplot', true);

Figure contains 2 axes and other objects of type subplottext. Axes 1 with title Before Normalization contains 4 objects of type line. These objects represent Invariant set, Smooth curve. Axes 2 with title After Normalization contains 3 objects of type line. This object represents Invariant set.

При совершенных экспериментальных условиях точки данных с равными значениями выражения упали бы вдоль M = 0 линий, которые представляют отношение экспрессии гена 1. Однако окрасьте смещение, заставил измеренные значения в одном канале быть выше, чем другой канал, как замечено в Перед графиком нормализации. Нормализация откорректировала отклонение, как замечено в После графика нормализации.

Ссылки

[1] Цзэн, G.C., О, Min-Kyu, Rohlin, L., Ляо, J.C., и Вонг, W.H. (2001) Проблемы в анализе комплементарной ДНК микромассивов: качественная фильтрация, нормализация канала, модели изменений и оценка генных эффектов. Исследование Нуклеиновых кислот. 29, 2549-2557.

[2] Хоффман, R., Seidl, T. и Dugas, M. (2002) Сильное воздействие нормализации на обнаружении дифференцированно описанных генов в анализе микроданных массива олигонуклеотида. Биология генома. 3 (7): исследование 0033.1-0033.11.

Введен в R2006a

Документация

mainvarsetnorm

Синтаксис

Аргументы

Описание

Примеры

Нормируйте микроданные массива

Ссылки

Смотрите также

Документация Bioinformatics Toolbox

Поддержка