geneentropyfilter

Удалите гены с низкими энтропийными значениями выражения

Синтаксис

Mask = geneentropyfilter(Data)
[Mask, FData] = geneentropyfilter(Data)
[Mask, FData, FNames] = geneentropyfilter(Data, Names)
geneentropyfilter(..., 'Percentile', PercentileValue)

Аргументы

Data

Объект DataMatrix или числовая матрица, где каждая строка соответствует результатам эксперимента для одного гена. Каждый столбец является результатами для всех генов из одного эксперимента.

Names

Массив ячеек из символьных векторов или вектор строки, где каждый элемент соответствует имени гена для каждой строки экспериментальных данных. Names имеет одинаковое число строк как Data с каждой строкой, содержащей имя или ID гена в наборе данных.

PercentileValue

Свойство задать процентиль, ниже которой удалены генные данные. Введите значение от 0 до 100.

Описание

Mask = geneentropyfilter(Data) идентифицирует профили экспрессии гена в Data с энтропийными значениями меньше, чем 10-я процентиль.

Mask является логическим вектором с одним элементом для каждой строки в Data. Элементы Mask, соответствующего строкам с отклонением, больше, чем порог, имеют значение 1 и тех с отклонением меньше, чем порогом является 0.

[Mask, FData] = geneentropyfilter(Data) возвращает FData, отфильтрованную матрицу данных. Можно также создать FData с помощью FData = Data(Mask,:).

[Mask, FData, FNames] = geneentropyfilter(Data, Names) возвращает FNames, отфильтрованный массив names, где Names является массивом ячеек из символьных векторов или вектором строки имен генов, соответствующих каждой строке Data. Можно также создать FNames с помощью FNames = Names(Mask).

Примечание

Если Data является объектом DataMatrix с заданными именами строки, вы не должны обеспечивать второй вход Names, чтобы возвратить третий вывод FNames.

geneentropyfilter(..., 'Percentile', PercentileValue) удаляет из Data, экспериментальных данных, профилей экспрессии гена с энтропийными значениями меньше, чем PercentileValue, заданная процентиль.

Примеры

  1. Загрузите MAT-файл, которому предоставляют программное обеспечение Bioinformatics Toolbox™, которое содержит данные о дрожжах. Этот MAT-файл включает три переменные: yeastvalues, матрица данных об экспрессии гена, genes, массива ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues, и times, вектора временных стоимостей для маркировки столбцов в yeastvalues

    load yeastdata
  2. Удалите гены с низкими энтропийными значениями выражения.

    [fyeastvalues, fgenes] = geneentropyfilter(yeastvalues,genes);

Ссылки

[1] Kohane I.S., Kho A.T., Бьютт A.J. (2003), микромассивы для интегральной геномики, Кембриджа, нажатия MA:MIT.

Представлено до R2006a