genelowvalfilter

Удалите профили генов с низкими абсолютными значениями

Описание

пример

Mask = genelowvalfilter(Data) возвращает логический вектор Mask идентификация профилей экспрессии генов в Data которые имеют абсолютные уровни выражения в наименьших 10% набора данных.

Эксперименты по профилю экспрессии генов имеют данные, где абсолютные значения очень низки. Качество данных этого типа часто является плохим из-за больших ошибок квантования или просто плохой точечной гибридизации. Используйте эту функцию для фильтрации данных.

пример

[Mask,FData] = genelowvalfilter(Data) также возвращается FData, матрица данных, содержащая фильтрованные профили выражений.

пример

[Mask,FData,FNames] = genelowvalfilter(Data,geneNames) также возвращается FNames, массив ячеек фильтрованных имен генов или идентификаторов. Необходимо указать geneNames для возврата FNames если только Data является DataMatrix объект с заданными именами строк.

пример

[___] = genelowvalfilter(___,Name,Value) использует дополнительные опции, заданные как один или несколько необязательных аргументы пары "имя-значение".

Примеры

свернуть все

Загрузите данные по образцам дрожжей.

load yeastdata;

Извлеките гены и соответствующие данные экспрессии, где абсолютные уровни экспрессии превышают 10-й процентиль.

[mask,filteredData,filteredGenes] = genelowvalfilter(yeastvalues,genes);

Сравните количество фильтрованных генов (filteredGenes) с количеством генов в исходном наборе данных (genes).

size (filteredGenes,1)
ans = 6394

Загрузите данные по образцам дрожжей.

load yeastdata;

Отметьте гены, которые имеют низкие абсолютные уровни экспрессии ниже 10-го процентиля набора данных.

mask = genelowvalfilter(yeastvalues);

Переменная genes содержит все имена генов в наборе данных о дрожжах. Используйте сгенерированный логический вектор mask извлечь гены, где уровни экспрессии превышают 10-й процентиль.

filteredGenes = genes(mask);

Извлеките соответствующие данные профиля экспрессии для выбранных генов из переменной yeastvalues, который содержит профили экспрессии каждого гена в наборе данных о дрожжах.

filteredData = yeastvalues(mask,:);

Загрузите данные по образцам дрожжей.

load yeastdata;

Извлеките гены и соответствующие данные экспрессии, где абсолютные уровни экспрессии превышают 30-й процентиль набора данных.

[mask,filteredData,filteredGenes] = genelowvalfilter(yeastvalues,genes,'Percentile',30);

Сравните количество фильтрованных генов (filteredGenes) с количеством генов в исходном наборе данных (genes).

size (filteredGenes,1)
ans = 6384

Входные параметры

свернуть все

Входные данные, заданные как DataMatrix объект или числовая матрица. Каждая строка матрицы соответствует экспериментальным результатам для одного гена. Каждый столбец представляет результаты для всех генов из одного эксперимента.

Имена генов или идентификаторы, заданные как массив ячеек из векторов символов или строкового вектора. Массив имеет одинаковое число строк как Data. Каждая строка содержит имя или идентификатор гена в наборе данных.

Примечание

Если Data является DataMatrix объект с заданными именами строк, вы не должны предоставлять второй вход geneNames для возврата третьего выхода FNames.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: 'AbsValue',10.5 задает genelowvalfilter чтобы удалить профили выражений с абсолютными значениями менее 10,5.

Значение процентиля, заданное как скалярное значение в области значений (от 0 до 100). Функция genelowvalfilter удаляет профили экспрессии генов с абсолютными значениями, меньшими, чем значение процентиля, которое задается с помощью 'Percentile'.

Пример: 'Percentile',50

Значение профиля абсолютного выражения, заданное как действительное число. Функция genelowvalfilter удаляет профили экспрессии генов с абсолютными значениями меньше абсолютного значения, которое задается с помощью 'AbsValue'.

Пример: 'AbsValue',10.5

Логический индикатор для выбора минимального или максимального абсолютного значения, заданного как true или false. Установите значение равным true для выбора минимального абсолютного значения. Установите значение false для выбора максимального абсолютного значения.

Пример: 'AnyVal',true

Выходные аргументы

свернуть все

Логический вектор, возвращенный как вектор 0 с и 1с для каждой строки в Data. Элементы Mask со значением 1 соответствуют строкам с абсолютными уровнями выражений, превышающими порог, и строкам со значением 0 соответствуют строкам с абсолютными уровнями выражения, меньшими или равными порогу.

Фильтрованная матрица данных, возвращенная как матрица данных, которая содержит профили экспрессии генов с абсолютными уровнями экспрессии, превышающими пороговое значение. Можно также создать FData использование FData = Data(Mask,:).

Массив фильтрованных имен генов, возвращенный как массив ячеек векторов символов или строки вектора. Он содержит имена генов или идентификаторы, соответствующие каждой строке Data который содержит профили экспрессии генов с абсолютными уровнями экспрессии, превышающими пороговое значение. Можно также создать FNames использование FNames = geneNames(Mask).

Ссылки

[1] Kohane, I.S., Kho, A.T., Butte, A.J. (2003). Микромассивы для интегративной геномики, первое издание (Cambridge, MA: MIT Press).

Представлено до R2006a