mspalign

Выравнивание массовых спектров из нескольких списков пиков из набора данных LC/MS или GC/MS

Синтаксис

[CMZ, AlignedPeaks] = mspalign(Peaklist)
[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'Quantile', QuantileValue, ...)
[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'EstimationMethod', EstimationMethodValue, ...)
[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'CorrectionMethod', CorrectionMethodValue, ...)
[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'ShowEstimation', ShowEstimationValue, ...)

Входные параметры

Peaklist Массив ячеек списков пиков из набора данных жидкостной хроматографии/масс-спектрометрии (LC/MS) или газовой хроматографии/масс-спектрометрии (GC/MS). Каждый элемент массива ячеек является двухколоночной матрицей со значениями m/z в первом столбце и значениями интенсивности ионов во втором столбце. Каждый элемент соответствует спектру или времени удержания.

Примечание

Вы можете использовать mzxml2peaks функцию или mspeaks функция для создания Peaklist массив ячеек.

QuantileValueЗначение, которое определяет, какой peaks выбираются методом оценки для создания CMZ, вектор общих значений m/z. Варианты являются любым значением ≥ 0 и ≤ 1. По умолчанию это 0.95.
EstimationMethodValueВектор символов или строка, задающая метод для оценки CMZ, вектор значений общей массы/заряда (m/z). Варианты:
  • histogram - Метод по умолчанию. Пиковые местоположения кластеризуются с помощью подхода оценки плотности ядра. Пиковая интенсивность ионов используется в качестве коэффициента взвешивания. Центр всех кластеров соответствует CMZ вектор.

  • regression - Берёт выборку расстояний между наблюдаемым значимым peaks и регрессирует межпиковое расстояние, чтобы создать CMZ вектор с аналогичными межэлементными расстояниями.

CorrectionMethodValueВектор символов или строка, задающая метод для выравнивания каждого пикового списка по CMZ вектор. Варианты:
  • nearest-neighbor - Метод по умолчанию. Для каждого общего пика в CMZ вектор, его аналог в каждом списке пиков является пиком, который наиболее близок к общему значению m/z пика.

  • shortest-path - Для каждого общего пика в CMZ вектор, его аналог в каждом списке пиков выбирается с помощью алгоритма кратчайшего пути.

ShowEstimationValueУправляет отображением графика оценки относительно метода оценки и вектора общих значений массы/заряда (m/z). Варианты true или false. По умолчанию либо:
  • false - Когда заданы возвращаемые значения.

  • true - Когда значения возврата не заданы.

Выходные аргументы

CMZВектор значений общей массы/заряда (m/z), оцененных mspalign функция.
AlignedPeaksМассив ячеек из списков пиков с той же формой, что и Peaklist, но с исправленными значениями m/z в первом столбце каждой матрицы.

Описание

[CMZ, AlignedPeaks] = mspalign(Peaklist) выравнивает спектры масс из нескольких списков пиков (центроидальные данные) путем первой оценки CMZвектор значений общей массы/заряда (m/z), оцененный с учетом peaks во всех спектрах в Peaklistмассив ячеек из списков пиков, где каждый элемент соответствует спектру или времени удержания. Затем он выравнивает peaks в каждом спектре по значениям в CMZ, создание AlignedPeaks, массив ячеек из выровненных списков пиков.

[CMZ, AlignedPeaks] = mspalign (Peaklist... 'PropertyName', PropertyValue, ...) вызывает mspalign с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'Quantile', QuantileValue, ...) определяет, какой peaks выбираются методом оценки для создания CMZ, вектор общих значений m/z. Выбор является скаляром между 0 и 1. По умолчанию это 0.95.

[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'EstimationMethod', EstimationMethodValue, ...) задает метод, используемый для оценки CMZ, вектор значений общей массы/заряда (m/z). Варианты:

  • histogram - Метод по умолчанию. Пиковые местоположения кластеризуются с помощью подхода оценки плотности ядра. Пиковая интенсивность ионов используется в качестве коэффициента взвешивания. Центр всех кластеров соответствует CMZ вектор.

  • regression - Берёт выборку расстояний между наблюдаемым значимым peaks и регрессирует межпиковое расстояние, чтобы создать CMZ вектор с аналогичными межэлементными расстояниями.

[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'CorrectionMethod', CorrectionMethodValue, ...) задает метод, используемый для выравнивания каждого пикового списка по CMZ вектор. Варианты:

  • nearest-neighbor - Метод по умолчанию. Для каждого общего пика в CMZ вектор, его аналог в каждом списке пиков является пиком, который наиболее близок к общему значению m/z пика.

  • shortest-path - Для каждого общего пика в CMZ вектор, его аналог в каждом списке пиков выбирается с помощью алгоритма кратчайшего пути.

[CMZ, AlignedPeaks] = mspalign(Peaklist, ...'ShowEstimation', ShowEstimationValue, ...) управляет отображением графика оценки относительно метода оценки и оценочного вектора общих значений масса/заряд (m/z). Варианты true или false. По умолчанию либо:

  • false - Когда заданы возвращаемые значения.

  • true - Когда значения возврата не заданы.

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, которое содержит переменные данных жидкостной хроматографии/масс-спектрометрии (LC/MS), включая peaks и ret_time. peaks - массив ячеек из списков пиков, где каждый элемент является двухколоночной матрицей из значений m/z и значений интенсивности ионов, и каждый элемент соответствует спектру или времени удержания. ret_time - вектор-столбец времени хранения, сопоставленный с набором данных LC/MS.

    load lcmsdata
  2. Повторно отобразите несогласованные данные, отобразите их в тепловой карте, а затем наложите точечный график.

    [MZ,Y] = msppresample(ms_peaks,5000);
    msheatmap(MZ,ret_time,log(Y))

    msdotplot(ms_peaks,ret_time)
  3. Нажмите кнопку «Масштабирование», а затем дважды или три раза щелкните точку на графике, чтобы масштабировать и увидеть, как точки, представляющие peaks, накладываются на изображение тепловой карты.

  4. Выровняйте списки пиков из массовых спектров с помощью методов оценки и коррекции по умолчанию.

    [CMZ, aligned_peaks] = mspalign(ms_peaks);
  5. Повторно отобразите несогласованные данные, отобразите их в тепловой карте, а затем наложите точечный график.

    [MZ2,Y2] = msppresample(aligned_peaks,5000);
    msheatmap(MZ2,ret_time,log(Y2))

    msdotplot(aligned_peaks,ret_time)
  6. Соедините оси двух тепловых графиков и увеличьте изображение, чтобы наблюдать деталь, чтобы сравнить выровненные и выровненные наборы данных LC/MS.

    linkaxes(findobj(0,'Tag','MSHeatMap'))
    axis([480 532 375 485])

Ссылки

[1] Джеффрис, Н. (2005) Алгоритмы выравнивания протеомных данных масс-спектрометрии. Биоинфоматика 21:14, 3066-3073.

[2] Purvine, S., Kolker, N. and Kolker, E. (2004) Спектральная оценка качества для протеомики масс-спектрометрии с высокой пропускной способностью. OMICS: Журнал интегративной биологии 8:3, 255-265.

Введенный в R2007a