mspeaks

Преобразуйте необработанные пиковые данные в пиковый список (централизованные данные)

Синтаксис

Peaklist = mspeaks(X, Intensities)
[Peaklist, PFWHH] = mspeaks(X, Intensities)
[Peaklist, PFWHH, PExt] = mspeaks(X, Intensities)
mspeaks(X, Intensities, ...'Base', BaseValue, ...)
mspeaks(X, Intensities, ...'Levels', LevelsValue, ...)
mspeaks(X, Intensities, ...'NoiseEstimator', NoiseEstimatorValue, ...)
mspeaks(X, Intensities, ...'Multiplier', MultiplierValue, ...)
mspeaks(X, Intensities, ...'Denoising', DenoisingValue, ...)
mspeaks(X, Intensities, ...'PeakLocation', PeakLocationValue, ...)
mspeaks(X, Intensities, ...'FWHHFilter', FWHHFilterValue, ...)
mspeaks(X, Intensities, ...'OverSegmentationFilter', OverSegmentationFilterValue, ...)
mspeaks(X, Intensities, ...'HeightFilter', HeightFilterValue, ...)
mspeaks(X, Intensities, ...'ShowPlot', ShowPlotValue, ...)
mspeaks(X, Intensities, ...'Style', StyleValue, ...)

Описание

Peaklist = mspeaks(X, Intensities) находит соответствующий peaks в необработанных, шумных пиковых сигнальных данных и создает Peaklist, двухколоночная матрица, содержащая значение оси разделения и интенсивность для каждого пика. X является вектором значений единиц разделения для набора сигналов с peaks. Intensities является матрицей значений интенсивности для набора пиков, которые имеют одну и ту же область значений единиц разделения.

[Peaklist, PFWHH] = mspeaks(X, Intensities) возвращает PFWHH, двухколоночная матрица, указывающая левое и правое положения полной ширины на маркерах половинной высоты (FWHH) для каждого пика. Для любого пика, не разрешенного в FWHH, mspeaks возвращает границы формы пика. Когда Intensities включает несколько сигналов, затем PFWHH - массив ячеек из матриц.

[Peaklist, PFWHH, PExt] = mspeaks(X, Intensities) возвращает PExt, матрицу из двух столбцов, указывающую левое и правое местоположения границ формы пика, определенных после шумоподавления вейвлета. Когда Intensities включает несколько сигналов, затем PExt - массив ячеек из матриц.

mspeaks (X, Intensities... 'PropertyName', PropertyValue, ...) вызывает mspeaks с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Заключайте каждую PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Эти имена свойства/пары значения свойств следующие:

mspeaks(X, Intensities, ...'Base', BaseValue, ...) задает основу вейвлета.

mspeaks(X, Intensities, ...'Levels', LevelsValue, ...) задает количество уровней для разложения вейвлета.

mspeaks(X, Intensities, ...'NoiseEstimator', NoiseEstimatorValue, ...) задает метод оценки порога, T, для фильтрации шумных компонентов при первом высокополосном разложении (y_h).

mspeaks(X, Intensities, ...'Multiplier', MultiplierValue, ...) задает пороговую константу умножения.

mspeaks(X, Intensities, ...'Denoising', DenoisingValue, ...) управляет использованием шумоподавления вейвлет, чтобы сглаживать сигнал. Варианты true (по умолчанию) или false.

mspeaks(X, Intensities, ...'PeakLocation', PeakLocationValue, ...) задает долю высоты пика, используемую для выбора точек, используемых для вычисления значения оси центроида для соответствующего пика. PeakLocationValue должно быть значением ≥ 0 и ≤ 1. По умолчанию это 1.0.

mspeaks(X, Intensities, ...'FWHHFilter', FWHHFilterValue, ...) задает минимальную полную ширину на половине высоты (FWHH), в единицах разделения, для сообщаемого peaks. Peaks с FWHH ниже этого значения исключаются из списка выхода Peaklist.

mspeaks(X, Intensities, ...'OverSegmentationFilter', OverSegmentationFilterValue, ...) задает минимальное расстояние между соседним peaks в единицах разделения. Когда сигнал не сглаживается должным образом, может оказаться, что несколько максимумов представляют один и тот же пик. Увеличьте это значение фильтра, чтобы объединить перегранный peaks в один пик.

mspeaks(X, Intensities, ...'HeightFilter', HeightFilterValue, ...) задает минимальную высоту для сообщаемого peaks. Peaks с высотами ниже этого значения исключаются из списка выхода Peaklist.

mspeaks(X, Intensities, ...'ShowPlot', ShowPlotValue, ...) управляет отображением графика исходного и сглаженного сигналов с peaks, включенными в выходную матрицу Peaklist отмечен.

mspeaks(X, Intensities, ...'Style', StyleValue, ...) задает стиль маркировки peaks на графике.

mspeaks находит peaks в данных любого метода разделения, который формирует сигнальные данные, такие как спектроскопия, ядерный магнитный резонанс (ЯМР), электрофорез, хроматография или масс-спектрометрия.

Входные параметры

X

Вектор значений единиц разделения для набора сигналов с peaks. Количество элементов в векторе равняется количеству строк в матрице Intensities. Модуль разделения может количественно определить длину волны, частоту, расстояние, время или m/z в зависимости от прибора, который генерирует данные сигнала.

Intensities

Матрица значений интенсивности для набора пиков, которые имеют одну и ту же область значений единиц разделения. Каждая строка соответствует значению единицы разделения, и каждый столбец соответствует либо набору сигналов с peaks, либо времени удержания. Количество строк равняется количеству элементов в векторе X.

BaseValue

Целое число от 2 на 20 задающий основу вейвлета.

По умолчанию: 4

LevelsValue

Целое число от 1 на 12 это задает количество уровней для разложения вейвлет.

По умолчанию: 10

NoiseEstimatorValue

Вектор символов, строка или скаляр, который задает метод для оценки порога, T, для фильтрации шумных компонентов при первом высокополосном разложении (y_h). Варианты:

  • mad - По умолчанию. Среднее абсолютное отклонение, которое вычисляет T = sqrt (2 * журнал (n) * безумие (y_h) / 0.6745, где n = количество строк в Intensities матрица.

  • std - Стандартное отклонение, которое вычисляет T = std (y_h).

  • Положительное действительное значение.

MultiplierValue

Положительное действительное значение, которое задает пороговую константу умножения.

По умолчанию: 1.0

DenoisingValue

Управляет использованием шумоподавления вейвлета, чтобы сглаживать сигнал. Варианты true (по умолчанию) или false.

Совет

Если ваши данные были ранее сглажены, например, с mslowess или mssgolay функция, вам не нужно использовать вейвлет шумоподавления. Установите это свойство на false.

PeakLocationValue

Значение, которое задает долю высоты пика, используемую для выбора точек, для вычисления значения оси разделения центроида соответствующего пика. Значение должно быть ≥ 0 и ≤ 1.

Примечание

Когда PeakLocationValue = 1.0, положение пика на максимуме пика. Когда PeakLocationValue = 0, mspeaks вычисляет положение пика со всеми точками от ближайшего минимума слева от пика до ближайшего минимума справа от пика.

По умолчанию: 1.0

FWHHFilterValue

Положительное действительное значение, которое задает минимальную полную ширину на половине высоты (FWHH), в единицах разделения, для сообщаемого peaks. Peaks с FWHH ниже этого значения исключаются из списка выхода Peaklist.

По умолчанию: 0

OverSegmentationFilterValue

Положительное действительное значение, которое задает минимальное расстояние в единицах разделения между соседним peaks. Когда сигнал не сглаживается должным образом, может оказаться, что несколько максимумов представляют один и тот же пик. Увеличьте это значение фильтра, чтобы объединить перегранный peaks в один пик.

По умолчанию: 0

HeightFilterValue

Положительное действительное значение, которое задает минимальную высоту для сообщаемого peaks.

По умолчанию: 0

ShowPlotValue

Управляет отображением графика исходного сигнала и сглаженного сигнала с peaks, включенными в выходную матрицу Peaklist отмечен. Варианты true, false, или I, целое число, задающее индекс спектра в Intensities. Если установлено значение true, первый спектр в Intensities нанесен на график. По умолчанию это:

  • false - Когда вы задаете возвращаемые значения.

  • true - Когда вы не задаете возвращаемые значения.

StyleValue

Вектор символов или строка, задающая стиль для маркировки peaks на графике. Варианты:

  • 'peak' (по умолчанию) - помещает маркер в пик гребня.

  • 'exttriangle' - Рисует треугольник, используя пиковый крест и границы.

  • 'fwhhtriangle' - Рисует треугольник, используя пиковый крест и точки FWHH.

  • 'extline' - Помещает маркер на пик гребня и вертикальные линии в границах.

  • 'fwhhline' - Помещает маркер в пик гребня и горизонтальную линию в FWHH.

Выходные аргументы

Peaklist

Двухколоночная матрица, где каждая строка соответствует пику. Первый столбец содержит значения единиц разделения (указывающие на расположение peaks вдоль оси разделения). Второй столбец содержит значения интенсивности. Когда Intensities включает несколько сигналов, затем Peaklist - массив ячеек из матриц, каждый из которых содержит список пиков.

PFWHH

Двухколоночная матрица, указывающая левое и правое положения полной ширины на маркерах половинной высоты (FWHH) для каждого пика. Для любого пика, не разрешенного в FWHH, mspeaks возвращает границы формы пика. Когда Intensities включает несколько сигналов, затем PFWHH - массив ячеек из матриц.

PExt

Двухколоночная матрица, указывающая левое и правое положения границ формы пика, определенных после шумоподавления вейвлета. Когда Intensities включает несколько сигналов, затем PExt - массив ячеек из матриц.

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, который содержит две переменные данных масс-спектрометрии, MZ_lo_res и Y_lo_res. MZ_lo_res является вектором значений m/z для множества спектров. Y_lo_res является матрицей значений интенсивности для множества массовых спектров, которые имеют одинаковые области значений m/z.

    load sample_lo_res
  2. Отрегулируйте базовую линию восьми спектров, сохраненных в Y_lo_res.

    YB = msbackadj(MZ_lo_res,Y_lo_res);
  3. Преобразовать необработанные данные масс-спектрометрии в список пиков путем нахождения соответствующего peaks в каждом спектре.

    P = mspeaks(MZ_lo_res,YB);
  4. Постройте график третьего спектра в YB, матрица скорректированных по базовому уровню значений интенсивности с отмеченным обнаруженным peaks.

    P = mspeaks(MZ_lo_res,YB,'SHOWPLOT',3);

  5. Сглаживайте сигнал, используя mslowess функция. Затем преобразуйте сглаженные данные в список пиков путем нахождения соответствующего peaks и построения третьего спектра.

    YS = mslowess(MZ_lo_res,YB,'SHOWPLOT',3);

    P = mspeaks(MZ_lo_res,YS,'DENOISING',false,'SHOWPLOT',3);

  6. Используйте cellfun функция для удаления всего peaks со значениями m/z менее 2000 из восьми пиков, перечисленных в выходных P. Затем постройте график peaks третьего спектра (в красном) по его сглаженному сигналу (в синем).

    Q = cellfun(@(p) p(p(:,1)>2000,:),P,'UniformOutput',false);
    figure
    plot(MZ_lo_res,YS(:,3),'b',Q{3}(:,1),Q{3}(:,2),'rx')
    xlabel('Mass/Charge (M/Z)')
    ylabel('Relative Intensity')
    axis([0 20000 -5 95])

Алгоритмы

mspeaks преобразует необработанные пиковые данные в пиковый список (центроидальные данные) путем:

  1. Сглаживание сигнала с помощью неопределенного преобразования вейвлета с коэффициентами Daubechies

  2. Назначение пиковых местоположений

  3. Оценка шума

  4. Исключение peaks, которые не удовлетворяют заданным критериям

Ссылки

[1] Morris, J.S., Coombes, K.R., Koomen, J., Baggerly, K.A., and Kobayash, R. (2005) Редукция данных и количественная оценка для масс-спектрометрии в биомедицинских применениях с использованием среднего спектра. Биоинфоматика 21:9, 1764-1775.

[2] Ясуй, Я., Пепе, М., Томпсон, М.Л., Адам, Б.Л., Райт, Г.Л., Цюй, Я., Поттер, Ж.Д., Winget, M., Thornquist, M. and Feng, Z. (2003) Data-analytic strategy for belek biomarker discovery: profiling of high-dimensional proteomic data for cancer detection. Биостатистика 4:3, 449-463.

[3] Donoho, D.L., and Johnstone, I.M. (1995) Адаптация к неизвестной гладкости через усадку вейвлета. J. Am. Statist. Asso. 90, 1200–1224.

[4] Strang, G. and Nguyen, T. (1996) Wavelets and Filter Banks (Wellesley: Cambridge Press).

[5] Coombes, K.R., Tsavachidis, S., Моррис, J.S., Baggerly, K.A., Хун, Член конгресса, и Kuerer, H.M. (2005) Улучшенное пиковое обнаружение и определение количества данных масс-спектрометрии, приобретенных от увеличенной поверхностью лазерной десорбции и ионизации спектрами шумоподавления с неподкошенным дискретным вейвлетом, преобразовывают. Протеомика 5 (16), 4107-4117 .

Введенный в R2007a