exponenta event banner

genevarfilter

Фильтровать гены с небольшой дисперсией профиля

Синтаксис

Mask = genevarfilter(Data)
[Mask, FData] = genevarfilter(Data)
[Mask, FData, FNames] = genevarfilter(Data, Names)
genevarfilter(..., 'Percentile', PercentileValue, ...)
genevarfilter(..., 'AbsValue', AbsValueValue, ...)

Аргументы

Data

Объект DataMatrix или числовая матрица, где каждая строка соответствует гену. Если матрица, первый столбец является именами генов, и каждый дополнительный столбец является результатами эксперимента.

Names

Клеточный массив символьных векторов или строковых векторов, где каждый элемент соответствует имени гена для каждой строки экспериментальных данных. Names имеет то же количество строк, что и Data с каждой строкой, содержащей имя или идентификатор гена в наборе данных.

PercentileValue

Указывает процентиль, ниже которого удаляются профили экспрессии генов. Варианты являются целыми числами из 0 кому 100. По умолчанию: 10.

AbsValueValue

Свойство для указания абсолютного значения, ниже которого удаляются профили экспрессии генов.

Описание

Эксперименты по профилированию генов обычно включают гены, которые проявляют небольшие вариации в своем профиле и обычно не представляют интереса. Эти гены обычно удаляются из данных.

Mask = genevarfilter(Data) вычисляет дисперсию для каждого профиля экспрессии генов в Data и возвращает Mask, который идентифицирует профили экспрессии генов с дисперсией меньше 10-го процентиля. Mask является логическим вектором с одним элементом для каждой строки в Data. Элементы Mask соответствующие строкам с дисперсией, превышающей пороговое значение, имеют значение 1, и те, у кого дисперсия меньше порогового значения, являются 0.

[Mask, FData] = genevarfilter(Data) вычисляет дисперсию для каждого профиля экспрессии генов в Data и возвращает FDataотфильтрованная матрица данных, в которой профили экспрессии генов с низкой вариацией удалены. Можно также создать FData использование FData = Data(Mask,:).

[Mask, FData, FNames] = genevarfilter(Data, Names) прибыль FNamesмассив отфильтрованных имен, в котором имена, связанные с профилями экспрессии генов с низкой вариацией, удаляются. Names - клеточный массив символьных векторов или строковых векторов имен генов, соответствующих каждой строке в Data. Можно также создать FNames использование FNames = Names(Mask).

Примечание

Если Data является объектом DataMatrix с указанными именами строк, нет необходимости предоставлять второй ввод Names для возврата третьего выходного сигнала FNames.

genevarfilter(..., 'PropertyName', PropertyValue, ...) требования genevarfilter с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

genevarfilter(..., 'Percentile', PercentileValue, ...) удаляет из Data, экспериментальные данные, профили экспрессии генов с дисперсией, меньшей, чем процентиль, указанный PercentileValue. Варианты являются целыми числами из 0 кому 100. По умолчанию: 10.

genevarfilter(..., 'AbsValue', AbsValueValue, ...) удаляет из Data , экспериментальные данные, профили экспрессии генов с дисперсией менее AbsValueValue.

Примеры

  1. Загрузите MAT-файл, поставляемый с программным обеспечением Bioinformatics Toolbox™, который содержит дрожжевые данные. Этот MAT-файл включает три переменные: yeastvaluesматрица данных экспрессии генов, genesмассив ячеек регистрационных номеров GenBank ® для маркировки строк вyeastvalues, и times, вектор значений времени для маркировки столбцов в yeastvalues

    load yeastdata
  2. Фильтровать гены с небольшой дисперсией профиля.

    [fyeastvalues, fgenes] = genevarfilter(yeastvalues,genes);

Ссылки

[1] Kohane I.S., Kho A.T., Butte A.J. (2003), Микрочипы для интегративной геномики, Кембридж, MA: MIT Press.

Представлен до R2006a