exponenta event banner

SimBiology.gsa. MPGSA

Объект, содержащий результаты многопараметрического анализа глобальной чувствительности (MPGSA)

Описание

SimBiology.gsa.MPGSA объект содержит результаты многопараметрического анализа глобальной чувствительности [1], возвращенные sbiompgsa.

Создание

Создать SimBiology.gsa.MPGSA объект с использованием sbiompgsa.

Свойства

развернуть все

Это свойство доступно только для чтения.

Выражения откликов модели, заданные как массив ячеек символьных векторов.

Типы данных: cell

Это свойство доступно только для чтения.

Статистика Колмогорова-Смирнова, уточнена в виде таблицы. Размер таблицы - [params, classifiers], где params - количество входных параметров, а classifiers - количество классификаторов. Вход[i,j] содержит статистику Колмогорова-Смирнова, возвращенную kstest2 (Statistics and Machine Learning Toolbox) сравнение двух eCDF i-го параметра, принятых и отклоненных j-м классификатором. Если все пробы приняты или отклонены классификатором, введите [i,j] имеет значение NaN.

VariableNames содержит выражения классификатора, указанные в качестве входных данных для sbiompgsa. Длинные выражения усекаются с добавлением '(classifier i)', где i - индекс классификатора. VariableDescriptions содержит неусеченные выражения классификатора.

Типы данных: table

Это свойство доступно только для чтения.

Вычисленные данные eCDF, заданные как массив ячеек числовых векторов. Размер массива: [params,4,classifiers], где params - количество входных параметров и классификаторов - количество классификаторов.

Клетки [i,1:2,j] содержат выходные данные f (Статистика и инструментарий машинного обучения) и x (Статистика и инструментарий машинного обучения) из ecdf Функция (Statistics and Machine Learning Toolbox) для образцов параметра i, принятых классификатором j.

Клетки [i,3:4,j] содержат соответствующие выходы для выборок параметра i, отклоненных классификатором j.

Если классификатор принимает все выборки или отклоняет все выборки, соответствующие данные eCDF пусты.

Типы данных: cell

Это свойство доступно только для чтения.

Уровень значимости двустороннего теста Колмогорова-Смирнова, определяемый как скалярное значение в диапазоне (0,1). Для получения более подробной информации см. kstest2 (Статистика и инструментарий машинного обучения).

Типы данных: double

Это свойство доступно только для чтения.

Асимптотические p-значения для тестов Колмогорова-Смирнова, указанные в таблице. Размер таблицы - [params, classifiers], где params - количество входных параметров, а classifiers - количество классификаторов .

Вход [i,j] содержит значения p, возвращенные kstest2 (Statistics and Machine Learning Toolbox) сравнение двух eCDF i-го параметра, принятых и отклоненных j-м классификатором. Если все пробы приняты или отклонены классификатором, введите [i,j] имеет значение NaN.

VariableNames содержит выражения классификатора, указанные в качестве входных данных для sbiompgsa. Длинные выражения усекаются с добавлением '(classifier i)', где i - индекс классификатора. VariableDescriptions содержит неусеченные выражения классификатора.

Типы данных: table

Это свойство доступно только для чтения.

Флаги, указывающие, принимаются ли образцы классификаторами, указанные как таблица. Размер таблицы - [NumberSamples, classifiers], где NumberSamples - количество выборок параметров, а classifiers - количество классификаторов.

VariableNames содержит выражения классификатора, указанные в качестве входных данных для sbiompgsa. Длинные выражения усекаются с добавлением '(classifier i)', где i - индекс классификатора. VariableDescriptions содержит неусеченные выражения классификатора.

Типы данных: table

Это свойство доступно только для чтения.

Имена откликов модели или наблюдаемых объектов, указанных как массив ячеек символьных векторов.

Типы данных: char

Это свойство доступно только для чтения.

Выборочные значения параметров, указанные как таблица. Каждая строка представляет один набор параметров, а каждый столбец - один входной параметр. Дополнительные сведения см. в разделе Многопараметрический анализ глобальной чувствительности (MPGSA).

Типы данных: table

Это свойство доступно только для чтения.

Данные моделирования, такие как данные моделирования и выборки параметров, используемые для многопараметрического анализа глобальной чувствительности, задаются как структура. Структура содержит следующие поля.

  • SimFunctionSimFunction используется для моделирования откликов модели или наблюдаемых объектов.

  • SimDataSimData массив размеров [NumberSamples,1], где 'NumberSamples' - количество выборок. Массив содержит результаты моделирования из ParameterSamples.

  • OutputTimes - Числовой вектор столбца, содержащий общий вектор времени всех SimData объекты.

  • Bounds - Числовая матрица размера [params,2]. params - количество входных параметров. Первый столбец содержит нижние границы, а второй столбец содержит верхние границы для входов чувствительности.

    Для этого поля установлено значение [] если при вызове в качестве входных данных были указаны значения образцов параметров sbiompgsa.

  • DoseTables - Массив ячеек таблиц доз, используемых для SimFunction оценка. DoseTables - выходной сигнал getTable(doseInput), где doseInput - стоимость, определенная для 'Doses' аргумент пары имя-значение в вызове sbiosobol или sbiompgsa. Если дозы не применяются, в этом поле устанавливается значение [].

  • ValidSample - Логический вектор размера [NumberSamples,1] указывает, не удалось ли выполнить моделирование для конкретного образца. Повторная выборка данных моделирования (SimData) может привести к NaN значения, если данные экстраполированы. Такие SimData указаны как недействительные.

  • InterpolationMethod - Наименование метода интерполяции для SimData.

  • SamplingMethod - Название метода отбора проб, используемого для рисования ParameterSamples. При звонке sbiompgsa с samples (выборочные величины модели) в качестве входных данных для этого поля соответствующего объекта результатов устанавливается значение 'unknown'.

  • RandomState - Структура, содержащая состояние rng перед рисованием ParameterSamples. При звонке sbiompgsa с samples(значения образца параметра) в качестве входных данных, это свойство соответствующего объекта результатов [].

Типы данных: struct

Функции объекта

plotDataПостроение сводки квантилей моделирования модели из глобального анализа чувствительности (требуется набор инструментов для статистического и машинного обучения)
plotГрафик эмпирического CDF многопараметрического анализа глобальной чувствительности
barСоздание штрихового графика статистики многопараметрического анализа глобальной чувствительности
histogramПостроить гистограмму результатов многопараметрического анализа глобальной чувствительности

Примеры

свернуть все

Загрузить модель распределения лекарств, опосредованных мишенью (TMDD).

sbioloadproject tmdd_with_TO.sbproj

Получить активный конфигурационный набор и установить целевую занятость (TO) в качестве ответа.

cs = getconfigset(m1);
cs.RuntimeOptions.StatesToLog = 'TO';

Моделирование модели и печать TO профиль.

sbioplot(sbiosimulate(m1,cs));

Figure contains an axes. The axes with title States versus Time contains an object of type line. This object represents TO.

Определите порог риска убытков (площадь под кривой профиля распоряжения о перемещении материалов) для целевой занятости.

classifier = 'trapz(time,TO) <= 0.1';

Выполните MPGSA для поиска чувствительных параметров относительно транспортного заказа. Изменение значений параметров между предварительно определенными границами для создания 10 000 выборок параметров.

% Suppress an information warning that is issued during simulation.
warnSettings = warning('off', 'SimBiology:sbservices:SB_DIMANALYSISNOTDONE_MATLABFCN_UCON');
rng(0,'twister'); % For reproducibility
params = {'kel','ksyn','kdeg','km'};
bounds = [0.1, 1; 
          0.1, 1;
          0.1, 1;
          0.1, 1];
mpgsaResults = sbiompgsa(m1,params,classifier,'Bounds',bounds,'NumberSamples',10000)
mpgsaResults = 
  MPGSA with properties:

                    Classifiers: {'trapz(time,TO) <= 0.1'}
    KolmogorovSmirnovStatistics: [4x1 table]
                       ECDFData: {4x4 cell}
              SignificanceLevel: 0.0500
                        PValues: [4x1 table]
              SupportHypothesis: [10000x1 table]
                    Observables: {'TO'}
               ParameterSamples: [10000x4 table]
                 SimulationInfo: [1x1 struct]

Постройте график квантилей отклика смоделированной модели.

plotData(mpgsaResults);

Figure contains an axes. The axes contains 12 objects of type line, patch. These objects represent model simulation, 90.0% region, mean value.

Постройте график эмпирических кумулятивных функций распределения (eCDF) принятых и отклоненных образцов. За исключением kmни один из параметров не показывает существенной разницы в eCDF для принятых и отклоненных образцов. km на графике показано большое расстояние Колмогорова - Смирнова (К-С) между eCDF принятых и отбракованных образцов. Расстояние K-S - это максимальное абсолютное расстояние между двумя кривыми eCDF.

h = plot(mpgsaResults);
% Resize the figure.
pos = h.Position(:);
h.Position(:) = [pos(1) pos(2) pos(3)*2 pos(4)*2];

Figure contains 4 axes. Axes 1 with title trapz(time,TO) <= 0.1 contains 2 objects of type stair. These objects represent accepted samples, rejected samples. Axes 2 contains 2 objects of type stair. These objects represent accepted samples, rejected samples. Axes 3 contains 2 objects of type stair. These objects represent accepted samples, rejected samples. Axes 4 contains 2 objects of type stair. These objects represent accepted samples, rejected samples.

Чтобы вычислить расстояние K-S между двумя eCDF, SimBiology использует двусторонний тест, основанный на нулевой гипотезе, что два распределения принятых и отклоненных выборок равны. Посмотрите kstest2 (Статистика и инструментарий машинного обучения) для получения подробной информации. Если расстояние K-S велико, то два распределения различны, что означает, что классификация выборок чувствительна к изменениям входного параметра. С другой стороны, если расстояние K-S невелико, то изменения входного параметра не влияют на классификацию выборок. Результаты показывают, что классификация нечувствительна к входному параметру. Чтобы оценить значимость статистики K-S, отвергающей нулевую гипотезу, можно изучить p-значения.

bar(mpgsaResults)

Figure contains an axes. The axes with title trapz(time,TO) <= 0.1 contains 11 objects of type patch, line. These objects represent K-S Statistic, P-Value.

Штрих-график показывает две полосы для каждого параметра: одну для K-S расстояния (статистика K-S) и другую для соответствующего p-значения. Вы отвергаете нулевую гипотезу, если значение p меньше уровня значимости. Крест (x) отображается для любого значения p, которое почти равно 0. Можно увидеть точное значение p, соответствующее каждому параметру.

[mpgsaResults.ParameterSamples.Properties.VariableNames',mpgsaResults.PValues]
ans=4×2 table
      Var1      trapz(time,TO) <= 0.1
    ________    _____________________

    {'kel' }          0.0021877      
    {'ksyn'}                  1      
    {'kdeg'}            0.99983      
    {'km'  }                  0      

P-значения km и kel меньше уровня значимости (0,05), что подтверждает альтернативную гипотезу о том, что принятые и отклоненные выборки происходят из различных распределений. Другими словами, классификация образцов чувствительна к km и kel но не к другим параметрам (kdeg и ksyn).

Также можно построить гистограммы принятых и отклоненных проб. Исторограммы позволяют увидеть тенденции в принятых и отклоненных образцах. В этом примере гистограмма km показывает, что больше принятых образцов для больших km значения, в то время как kel гистограмма показывает, что отбракованных образцов меньше kel увеличивается.

h2 = histogram(mpgsaResults);
% Resize the figure.
pos = h2.Position(:);
h2.Position(:) = [pos(1) pos(2) pos(3)*2 pos(4)*2];

Figure contains 4 axes. Axes 1 with title trapz(time,TO) <= 0.1 contains 2 objects of type histogram. These objects represent accepted samples, rejected samples. Axes 2 contains 2 objects of type histogram. These objects represent accepted samples, rejected samples. Axes 3 contains 2 objects of type histogram. These objects represent accepted samples, rejected samples. Axes 4 contains 2 objects of type histogram. These objects represent accepted samples, rejected samples.

Восстановите параметры предупреждения.

warning(warnSettings);

Подробнее

развернуть все

Ссылки

[1] Тиеманн, Кристиан А., Йоеп Ванлье, Маайке Х. Остервер, Альберт К. Гроен, Петер А. Дж. Хилберс и Натал А. В. ван Риль. «Анализ траектории параметров для определения эффектов лечения фармакологических вмешательств». Под редакцией Скотта Маркела. Вычислительная биология PLoS 9, № 8 (1 августа 2013 г.): e1003166. https://doi.org/10.1371/journal.pcbi.1003166.

См. также

| | | (инструментарий статистики и машинного обучения) | (Набор инструментов для статистики и машинного обучения)

Представлен в R2020a