exponenta event banner

mavolcanoplot

Создание отношения значимости и экспрессии генов (кратное изменение) график рассеяния данных микрочипов

Синтаксис

mavolcanoplot(DataX, DataY, PValues)
SigStructure = mavolcanoplot(DataX, DataY, PValues)
... mavolcanoplot(..., 'Labels', LabelsValue, ...)
... mavolcanoplot(..., 'LogTrans', LogTransValue, ...)
... mavolcanoplot(..., 'PCutoff', PCutoffValue, ...)
... mavolcanoplot(..., 'Foldchange', FoldchangeValue, ...)
... mavolcanoplot(..., 'PlotOnly', PlotOnlyValue, ...)

Входные аргументы

DataX, DataY

Объект DataMatrix, матрица или вектор значений экспрессии генов из одного экспериментального условия. Если объект DataMatrix или матрица, каждая строка является геном, каждый столбец является образцом, и среднее значение экспрессии рассчитывается для каждого гена.

Примечание

Если значения в DataX или DataY естественный масштаб, используйте LogTrans для преобразования их в масштаб log 2.

PValues

Одно из следующих действий:

  • Вектор столбца p-значений для каждого признака (например, гена) в наборе данных, например, возвращенный mattest.

  • Объект DataMatrix, содержащий значения p для каждой функции (например, гена) в наборе данных, например, mattest.

LabelsValue

Клеточный массив символьных векторов или строковых векторов, содержащих метки (обычно имена генов или идентификаторы наборов зондов) для данных. После создания графика можно щелкнуть точку данных для отображения связанной с ней метки. Если вы не предоставляете LabelsValue, точки данных помечены номерами строк из DataX и DataY.

LogTransValue

Свойство для управления преобразованием данных в DataX и DataY от естественного до логарифмического 2 масштаба. Войти true для преобразования данных в масштаб log 2 или false. По умолчанию: false, что предполагает, что данные уже имеют масштаб log 2.

PCutoffValue

Позволяет задать пороговое значение p для определения статистически значимых точек данных. Это значение отображается графически в виде горизонтальной линии на графике. По умолчанию: 0.05, что эквивалентно 1,3010 по шкале -log10 (p-значение). Значение должно быть в диапазоне от 0 до 1.

Примечание

Можно также изменить отсечение p-значения в интерактивном режиме после создания графика.

FoldchangeValue

Позволяет задать кратное изменение отношения для определения точек данных, которые дифференциально выражены. По умолчанию: 2, что соответствует соотношению 1 и -1 по шкале log2 (отношение).

Примечание

После создания графика можно также изменить изменение гибки в интерактивном режиме.

PlotOnlyValue

Управление отображением графика вулкана без компонентов пользовательского интерфейса. Варианты: true или false (по умолчанию).

Примечание

Если установить 'PlotOnly' свойство для trueможно по-прежнему отображать метки для точек данных щелчком мыши на точке данных, а также корректировать вертикальные линии изменения сгиба и горизонтальную линию отсечения p-значения, перетаскивая линии щелчком мыши.

Выходные аргументы

SigStructure

Структура, содержащая информацию для генов, которые считаются как статистически значимыми (выше отсечки p-значения), так и значительно дифференциально экспрессированными (вне значений кратного изменения). Поля перечислены ниже.

Описание

mavolcanoplot(DataX, DataY, PValues) создает график рассеяния данных экспрессии генов, строя график зависимости значимости от кратного изменения соотношений экспрессии генов двух наборов данных, DataX и DataY. Оно отображает значимость как -log10 (p-значение) из входных данных, PValues. DataX и DataY могут быть векторами, матрицами или объектами DataMatrix. PValues является вектором столбца или объектом DataMatrix.

SigStructure = mavolcanoplot(DataX, DataY, PValues) возвращает структуру, содержащую информацию для генов, которые считаются как статистически значимыми (выше отсечки p-значения), так и значительно дифференциально экспрессированными (вне значений кратного изменения). Поля в пределах SigStructure сортируются по значению p и включают в себя:

  • Name

  • PCutoff

  • FCThreshold

  • GeneLabels

  • PValues

  • FoldChanges

Примечание

Области PValues и FoldChanges будут являться либо векторами, либо объектами DataMatrix в зависимости от типа ввода PValues.

... mavolcanoplot(..., 'PropertyName', PropertyValue, ...) определяет дополнительные свойства, использующие пары имя/значение свойства в любом порядке. Эти пары имя/значение свойства следующие:

... mavolcanoplot(..., 'Labels', LabelsValue, ...) позволяет предоставить клеточный массив символьных векторов или строковых векторов, содержащих метки (обычно имена генов или идентификаторы наборов зондов) для данных. После создания графика можно щелкнуть точку данных для отображения связанной с ней метки. Если вы не предоставляете LabelsValue, точки данных помечены номерами строк из DataX и DataY.

... mavolcanoplot(..., 'LogTrans', LogTransValue, ...) управляет преобразованием данных из DataX и DataY в шкалу log2. Когда LogTransValue является true, mavolcanoplot преобразует данные из естественного масштаба в масштаб log2. По умолчанию: false, что предполагает, что данные уже имеют масштаб log2.

... mavolcanoplot(..., 'PCutoff', PCutoffValue, ...) позволяет задать отсечение значения p для определения статистически значимых точек данных. Это значение отображается графически в виде горизонтальной линии на графике. По умолчанию: 0.05, что эквивалентно 1,3010 по шкале -log10 (p-значение).

Примечание

Можно также изменить отсечение p-значения в интерактивном режиме после создания графика.

... mavolcanoplot(..., 'Foldchange', FoldchangeValue, ...) позволяет задать кратное изменение отношения для определения точек данных, которые дифференциально выражены. Изменения сгиба отображаются графически как две вертикальные линии на графике. По умолчанию: 2, что соответствует соотношению 1 и -1 по шкале log2 (отношение).

Примечание

После создания графика можно также изменить изменение гибки в интерактивном режиме.

... mavolcanoplot(..., 'PlotOnly', PlotOnlyValue, ...) управляет отображением графика вулкана без компонентов пользовательского интерфейса. Варианты: true или false (по умолчанию).

Примечание

Если установить 'PlotOnly' свойство для trueможно по-прежнему отображать метки для точек данных щелчком мыши на точке данных, а также корректировать вертикальные линии изменения сгиба и горизонтальную линию отсечения p-значения, перетаскивая линии щелчком мыши.

График вулкана показывает следующее:

  • -log10 (p-значение) против log2 (отношение) графика рассеяния генов

  • Две вертикальные линии сгиба изменяются на уровне сгиба 2, что соответствует соотношению 1 и -1 на шкале log2 (отношение). (Линии будут находиться на разных уровнях изменения сгиба, если вы использовали 'Foldchange' собственность.)

  • Одна горизонтальная линия на уровне 0,05 p-значения, что эквивалентно 1,3010 по шкале -log10 (p-значение). (Строка будет на другом уровне p-value, если вы использовали 'PCutoff' собственность.)

После отображения графика рассеяния вулкана можно в интерактивном режиме:

  • Отрегулируйте вертикальные линии изменения сгиба, перетащив одну линию щелчком мыши или введя значение в текстовое поле «Изменение сгиба».

  • Отрегулируйте горизонтальную линию отсечения p-значения путем перетаскивания щелчком мыши или ввода значения в текстовое поле Отсечение p-значения.

  • Отображение меток для точек данных щелчком мыши на точке данных.

  • Выберите ген из списка Регулируемый вверх или Регулируемый вниз, чтобы выделить соответствующую точку данных на графике. Для выбора нескольких генов нажмите и удерживайте клавишу Ctrl или Shift.

  • Увеличьте масштаб графика, выбрав меню «Сервис» > «Увеличить» или «Инструменты» > «Уменьшить».

  • Просмотрите списки значительно повышенных и пониженных генов и связанных с ними значений p и, при необходимости, экспортируйте метки, значения p и складывающиеся изменения в структуру в рабочей области MATLAB ®, щелкнув Экспорт (Export).

Примеры

  1. Загрузите MAT-файл, включенный в программное обеспечение Bioinformatics Toolbox™, которое содержит переменные данных Affymetrix ®, включаяdependentData и independentDataдве матрицы значений экспрессии генов из двух экспериментальных условий.

    load prostatecancerexpdata
  2. Используйте mattest функция для расчета значений p для значений экспрессии генов в двух матрицах.

    pvalues = mattest(dependentData, independentData);
  3. Используя две матрицы, pvalues рассчитано по mattest, и probesetIDs векторы столбцов обозначений, использование mavolcanoplot создать график распределения отношения значимости и экспрессии генов данных микрочипов из двух экспериментальных условий.

    mavolcanoplot(dependentData, independentData, pvalues,...
    'Labels', probesetIDs)
  4. Просмотр графика вулкана без компонентов пользовательского интерфейса.

    mavolcanoplot(dependentData, independentData, pvalues,...
    'Labels', probesetIDs,'Plotonly', true)

prostatecancerexpdata.mat файл, использованный в предыдущем примере, содержит данные Best et al., 2005.

Ссылки

[1] Кюи, Х., Черчилль, Г.А. (2003). Статистические тесты на дифференциальную экспрессию в экспериментах с микрочипами кДНК. Биология генома 4, 210.

[2] Best, C.J.M., Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Собирается, Я., Эриксон, Х. С., Георгевич, Л., Тангреа, М. А., Дюрей, П.Х., Гонсалес, С., Веласко, А., Линехан, В.М., Матусик, Р.Дж., Прайс, Д.К., Фигг, В.Д., Эммерт-Бак, М.Р., и Чуакки, Р.Ф. (2005). Молекулярные изменения при первичном раке предстательной железы после терапии андрогенной абляцией. Клинические исследования рака 11, 6823-6834.

Представлен в R2006a