exponenta event banner

mspeaks

Преобразование необработанных пиковых данных в список пиковых значений (данные по центру)

Синтаксис

Peaklist = mspeaks(X, Intensities)
[Peaklist, PFWHH] = mspeaks(X, Intensities)
[Peaklist, PFWHH, PExt] = mspeaks(X, Intensities)
mspeaks(X, Intensities, ...'Base', BaseValue, ...)
mspeaks(X, Intensities, ...'Levels', LevelsValue, ...)
mspeaks(X, Intensities, ...'NoiseEstimator', NoiseEstimatorValue, ...)
mspeaks(X, Intensities, ...'Multiplier', MultiplierValue, ...)
mspeaks(X, Intensities, ...'Denoising', DenoisingValue, ...)
mspeaks(X, Intensities, ...'PeakLocation', PeakLocationValue, ...)
mspeaks(X, Intensities, ...'FWHHFilter', FWHHFilterValue, ...)
mspeaks(X, Intensities, ...'OverSegmentationFilter', OverSegmentationFilterValue, ...)
mspeaks(X, Intensities, ...'HeightFilter', HeightFilterValue, ...)
mspeaks(X, Intensities, ...'ShowPlot', ShowPlotValue, ...)
mspeaks(X, Intensities, ...'Style', StyleValue, ...)

Описание

Peaklist = mspeaks(X, Intensities) находит соответствующие пики в необработанных, шумных пиковых данных сигнала и создает Peaklistматрица из двух столбцов, содержащая значение оси разделения и интенсивность для каждого пика. X - вектор единичных значений разделения для набора сигналов с пиками. Intensities - матрица значений интенсивности для набора пиков, которые имеют одинаковый диапазон единиц разделения.

[Peaklist, PFWHH] = mspeaks(X, Intensities) прибыль PFWHHматрица из двух столбцов, указывающая левое и правое расположения маркеров полной ширины на половине высоты (FWHH) для каждого пика. Для любого пика, не разрешенного в FWHH, mspeaks возвращает границы пиковой формы. Когда Intensities включает в себя несколько сигналов, затем PFWHH - массив ячеек матриц.

[Peaklist, PFWHH, PExt] = mspeaks(X, Intensities) прибыль PExtматрица из двух столбцов, указывающая левое и правое местоположения границ формы пика, определенных после деноизирования вейвлета. Когда Intensities включает в себя несколько сигналов, затем PExt - массив ячеек матриц.

mspeaks(X, Intensities, ...'PropertyName', PropertyValue, ...) требования mspeaks с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Заключить каждый PropertyName в одинарных кавычках. Каждый PropertyName нечувствителен к регистру. Эти пары имя/значение свойства следующие:

mspeaks(X, Intensities, ...'Base', BaseValue, ...) задает базу вейвлетов.

mspeaks(X, Intensities, ...'Levels', LevelsValue, ...) определяет количество уровней для вейвлет-декомпозиции.

mspeaks(X, Intensities, ...'NoiseEstimator', NoiseEstimatorValue, ...) определяет метод оценки порогового значения, T, для фильтрации шумных компонентов в первом высокополосном разложении (y_h).

mspeaks(X, Intensities, ...'Multiplier', MultiplierValue, ...) задает константу порогового множителя.

mspeaks(X, Intensities, ...'Denoising', DenoisingValue, ...) управляет использованием вейвлет-деноизирования для сглаживания сигнала. Варианты: true (по умолчанию) или false.

mspeaks(X, Intensities, ...'PeakLocation', PeakLocationValue, ...) задает пропорцию высоты пика для выбора точек, используемых для вычисления значения оси разделения центроидов соответствующего пика. PeakLocationValue должно быть значением ≥ 0 и ≤ 1. По умолчанию: 1.0.

mspeaks(X, Intensities, ...'FWHHFilter', FWHHFilterValue, ...) задает минимальную полную ширину на половине высоты (FWHH) в единицах разделения для указанных пиков. Пики с FWHH ниже этого значения исключены из выходного списка Peaklist.

mspeaks(X, Intensities, ...'OverSegmentationFilter', OverSegmentationFilterValue, ...) задает минимальное расстояние между соседними пиками в единицах разделения. Когда сигнал не сглажен соответствующим образом, множество максимумов может казаться представляющим один и тот же пик. Увеличьте это значение фильтра, чтобы объединить избыточно сегментированные пики в один пик.

mspeaks(X, Intensities, ...'HeightFilter', HeightFilterValue, ...) указывает минимальную высоту для сообщаемых пиков. Пики с высотой ниже этого значения исключены из списка вывода Peaklist.

mspeaks(X, Intensities, ...'ShowPlot', ShowPlotValue, ...) управляет отображением графика исходного и сглаженного сигнала с пиками, включенными в выходную матрицу Peaklist помечен.

mspeaks(X, Intensities, ...'Style', StyleValue, ...) задает стиль для обозначения вершин на графике.

mspeaks находит пики в данных из любого метода разделения, который производит данные сигнала, такие как спектроскопия, ядерный магнитный резонанс (ЯМР), электрофорез, хроматография или масс-спектрометрия.

Входные аргументы

X

Вектор единичных значений разделения для набора сигналов с пиками. Число элементов в векторе равно количеству строк в матрице Intensities. Блок разделения может количественно определять длину волны, частоту, расстояние, время или m/z в зависимости от прибора, который генерирует данные сигнала.

Intensities

Матрица значений интенсивности для набора пиков, которые имеют одинаковый диапазон единиц разделения. Каждая строка соответствует значению единицы разделения, и каждый столбец соответствует либо набору сигналов с пиками, либо времени удержания. Число строк равно количеству элементов в векторе X.

BaseValue

Целое число от 2 кому 20 который определяет базу вейвлетов.

По умолчанию: 4

LevelsValue

Целое число от 1 кому 12 определяет количество уровней для вейвлет-декомпозиции.

По умолчанию: 10

NoiseEstimatorValue

Символьный вектор, строка или скаляр, определяющий метод оценки порогового значения. T, для фильтрации шумных компонентов в первом высокополосном разложении (y_h). Возможны следующие варианты:

  • mad - По умолчанию. Среднее абсолютное отклонение, которое вычисляет T = sqrt(2*log(n))*mad(y_h) / 0.6745, где n = количество строк в Intensities матрица.

  • std - стандартное отклонение, которое вычисляется T = std(y_h).

  • Положительная реальная стоимость.

MultiplierValue

Положительное действительное значение, определяющее пороговую константу множителя.

По умолчанию: 1.0

DenoisingValue

Управляет использованием вейвлет-денойзинга для сглаживания сигнала. Варианты: true (по умолчанию) или false.

Совет

Если данные были предварительно сглажены, например, с помощью mslowess или mssgolay функция, вам не нужно использовать вейвлет денойзинг. Установить для этого свойства значение false.

PeakLocationValue

Значение, указывающее пропорцию высоты пика, используемой для выбора точек для вычисления значения оси разделения центроидов соответствующего пика. Значение должно быть ≥ 0 и ≤ 1.

Примечание

Когда PeakLocationValue = 1.0местоположение пика находится на максимуме пика. Когда PeakLocationValue = 0, mspeaks вычисляет местоположение пика со всеми точками от ближайшего минимума слева от пика до ближайшего минимума справа от пика.

По умолчанию: 1.0

FWHHFilterValue

Положительное реальное значение, определяющее минимальную полную ширину на половине высоты (FWHH) в единицах разделения для указанных пиков. Пики с FWHH ниже этого значения исключены из выходного списка Peaklist.

По умолчанию: 0

OverSegmentationFilterValue

Положительное действительное значение, определяющее минимальное расстояние между соседними пиками в единицах измерения. Когда сигнал не сглажен соответствующим образом, множество максимумов может казаться представляющим один и тот же пик. Увеличьте это значение фильтра, чтобы объединить избыточно сегментированные пики в один пик.

По умолчанию: 0

HeightFilterValue

Положительное действительное значение, указывающее минимальную высоту для указанных пиков.

По умолчанию: 0

ShowPlotValue

Управляет отображением графика исходного сигнала и сглаженного сигнала с пиками, включенными в выходную матрицу Peaklist помечен. Варианты: true, false, или I, целое число, указывающее индекс спектра в Intensities. Если установлено значение true, первый спектр в Intensities выводится на печать. Значение по умолчанию:

  • false - При указании возвращаемых значений.

  • true - Если возвращаемые значения не указаны.

StyleValue

Символьный вектор или строка, задающая стиль для обозначения пиков на графике. Возможны следующие варианты:

  • 'peak' (по умолчанию) - помещает маркер на гребень пика.

  • 'exttriangle' - построение треугольника с использованием гребня пика и границ.

  • 'fwhhtriangle' - рисует треугольник с использованием гребня пика и точек FWHH.

  • 'extline' - размещает маркер на гребне пика и вертикальные линии на границах.

  • 'fwhhline' - Помещает маркер на гребне пика и горизонтальную линию на FWHH.

Выходные аргументы

Peaklist

Матрица из двух столбцов, где каждая строка соответствует пику. Первый столбец содержит значения единиц разделения (указывающие расположение пиков вдоль оси разделения). Второй столбец содержит значения интенсивности. Когда Intensities включает в себя несколько сигналов, затем Peaklist - массив ячеек матриц, каждая из которых содержит список пиков.

PFWHH

Матрица из двух столбцов, указывающая левое и правое расположения маркеров полной ширины на половине высоты (FWHH) для каждого пика. Для любого пика, не разрешенного в FWHH, mspeaks возвращает границы пиковой формы. Когда Intensities включает в себя несколько сигналов, затем PFWHH - массив ячеек матриц.

PExt

Матрица из двух столбцов, указывающая левое и правое расположения границ формы пика, определенных после деноизирования импульса. Когда Intensities включает в себя несколько сигналов, затем PExt - массив ячеек матриц.

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, который содержит две переменные данных масс-спектрометрии, MZ_lo_res и Y_lo_res. MZ_lo_res является вектором значений m/z для набора спектров. Y_lo_res - матрица значений интенсивности для набора масс-спектров, которые имеют одинаковый диапазон m/z.

    load sample_lo_res
  2. Настройка базовой линии восьми спектров, хранящихся в Y_lo_res.

    YB = msbackadj(MZ_lo_res,Y_lo_res);
  3. Преобразование необработанных данных масс-спектрометрии в список пиков путем нахождения соответствующих пиков в каждом спектре.

    P = mspeaks(MZ_lo_res,YB);
  4. Постройте график третьего спектра в YBматрица скорректированных по базовой линии значений интенсивности с отмеченными пиками.

    P = mspeaks(MZ_lo_res,YB,'SHOWPLOT',3);

  5. Сглаживание сигнала с помощью mslowess функция. Затем преобразуют сглаженные данные в список пиков путем нахождения соответствующих пиков и строят график третьего спектра.

    YS = mslowess(MZ_lo_res,YB,'SHOWPLOT',3);

    P = mspeaks(MZ_lo_res,YS,'DENOISING',false,'SHOWPLOT',3);

  6. Используйте cellfun функция для удаления всех пиков со значениями m/z менее 2000 из восьми пиков, перечисленных в выходных данных P. Затем постройте графики пиков третьего спектра (красным цветом) над его сглаженным сигналом (синим цветом).

    Q = cellfun(@(p) p(p(:,1)>2000,:),P,'UniformOutput',false);
    figure
    plot(MZ_lo_res,YS(:,3),'b',Q{3}(:,1),Q{3}(:,2),'rx')
    xlabel('Mass/Charge (M/Z)')
    ylabel('Relative Intensity')
    axis([0 20000 -5 95])

Алгоритмы

mspeaks преобразует необработанные пиковые данные в пиковый список (центроидальные данные) с помощью:

  1. Сглаживание сигнала с использованием недекимированного вейвлет-преобразования с коэффициентами Daubechies

  2. Назначение пиковых местоположений

  3. Оценка шума

  4. Устранение пиков, не удовлетворяющих указанным критериям

Ссылки

[1] Моррис, J.S., Кумбс, K.R., Koomen, J., Baggerly, K.A. и Kobayash, R. (2005) Выделение и количественное определение характеристик масс-спектрометрии в биомедицинских применениях с использованием среднего спектра. Биоинфоматика 21:9, 1764-1775.

[2] Ясуи, Я., Пепе, М., Томпсон, М. Л., Адам, Б. Л., Райт, Г. Л., Winget, M., Thornquist, M. и Feng, Z. (2003) Стратегия анализа данных для открытия белковых биомаркеров: профилирование высокоразмерных протеомных данных для обнаружения рака. Биостатистика 4:3, 449-463.

[3] Donoho, D.L. и Johnstone, I.M. (1995) Адаптация к неизвестной гладкости посредством вейвлет-усадки. Дж. Ам. Статист. Ассо. 90, 1200–1224.

[4] Странг, Г. и Нгуен, Т. (1996) Вейвлетс и Фильтр Бэнкс (Wellesley: Cambridge Press).

[5] Кумбы, K.R., Tsavachidis, S., Morris, J.S., Baggerly, K.A., Hung, M.C. и Kuerer, H.M. (2005) Улучшенная детекция пиков и количественная оценка данных масс-спектрометрии, полученных из улучшенной поверхности лазерной десорбции и ионизации путем деноизоляции спектров Протеомика 5 (16), 4107-4117 .

Представлен в R2007a