exponenta event banner

sbiosobol

Выполнение глобального анализа чувствительности путем вычисления индексов Sobol первого и полного порядка (требуется набор инструментов статистики и машинного обучения)

Описание

пример

sobolResults = sbiosobol(modelObj,params,observables) выполняет глобальный анализ чувствительности [1] на модели SimBiology modelObj разложением отклонений observables по входам чувствительности params.

пример

sobolResults = sbiosobol(modelObj,params,observables,Name,Value) использует дополнительные параметры, заданные одним или несколькими аргументами пары имя-значение.

Примеры

свернуть все

Загрузить модель роста опухоли.

sbioloadproject tumor_growth_vpop_sa.sbproj

Получите вариант с расчетными параметрами и дозой для применения к модели.

v = getvariant(m1);
d = getdose(m1,'interval_dose');

Получить активный конфигурационный элемент и установить вес опухоли в качестве ответа.

cs = getconfigset(m1);
cs.RuntimeOptions.StatesToLog = 'tumor_weight';

Смоделировать модель и построить график профиля роста опухоли.

sbioplot(sbiosimulate(m1,cs,v,d));

Figure contains an axes. The axes with title States versus Time contains an object of type line. This object represents tumor_weight.

Выполните анализ глобальной чувствительности (GSA) на модели, чтобы найти параметры модели, к которым чувствителен рост опухоли.

Во-первых, извлеките представляющие интерес параметры модели, которые участвуют в фармакодинамике роста опухоли. Определите реакцию модели как вес опухоли.

modelParamNames = {'L0','L1','w0','k1','k2'};
outputName = 'tumor_weight';

Затем выполните GSA путем вычисления индексов Соболя первого и полного порядка с помощью sbiosobol. Набор 'ShowWaitBar' кому true для отображения хода моделирования. По умолчанию функция использует 1000 выборок параметров для вычисления индексов Соболя [1].

sobolResults = sbiosobol(m1,modelParamNames,outputName,'Variants',v,'Doses',d,'ShowWaitBar',true)
sobolResults = 
  Sobol with properties:

                Time: [444x1 double]
        SobolIndices: [5x1 struct]
            Variance: [444x1 table]
         Observables: {'[Tumor Growth Model].tumor_weight'}
    ParameterSamples: [1000x5 table]
      SimulationInfo: [1x1 struct]

Можно изменить количество проб, указав 'NumberSamples' аргумент пары имя-значение. Для функции требуется всего (number of input parameters + 2) * NumberSamples моделирование модели.

Показать средний отклик модели, результаты моделирования и закрашенную область, охватывающую 90% результатов моделирования.

plotData(sobolResults);

Figure contains an axes. The axes contains 12 objects of type line, patch. These objects represent model simulation, 90.0% region, mean value.

Можно настроить область квантиля на другой процент, указав 'Alphas' для нижнего и верхнего квантилей всех ответов модели. Например, альфа-значение 0,1 отображает затененную область между 100 * alpha и 100 * (1 - alpha) квантили всех смоделированных откликов модели.

plotData(sobolResults,'Alphas',0.1);

Figure contains an axes. The axes contains 12 objects of type line, patch. These objects represent model simulation, 80.0% region, mean value.

Постройте график временного хода индексов Соболя первого и общего порядка.

h = plot(sobolResults);
% Resize the figure.
h.Position(:) = [100 100 1280 800];

Figure contains 12 axes. Axes 1 with title [Tumor Growth Model].tumor_weight contains 3 objects of type line. Axes 2 with title [Tumor Growth Model].tumor_weight contains 3 objects of type line. Axes 3 contains 3 objects of type line. Axes 4 contains 3 objects of type line. Axes 5 contains 3 objects of type line. Axes 6 contains 3 objects of type line. Axes 7 contains 3 objects of type line. Axes 8 contains 3 objects of type line. Axes 9 contains 3 objects of type line. Axes 10 contains 3 objects of type line. Axes 11 contains 3 objects of type line. Axes 12 contains an object of type line.

Индекс Соболя первого порядка входного параметра дает долю общей дисперсии отклика, которую можно отнести только к вариациям входного параметра. Индекс общего порядка дает долю общей дисперсии отклика, которая может быть приписана любым вариациям параметра соединения, которые включают вариации входного параметра.

Из индексов Соболь сюжеты, параметры L1 и w0 кажутся наиболее чувствительными параметрами к массе опухоли до введения дозы при t = 7. Но после применения дозы, k1 и k2 становятся более чувствительными параметрами и вносят наибольший вклад в стадию дозирования веса опухоли. График общей дисперсии также показывает большую дисперсию для стадии после дозы при t > 35, чем для стадии до дозы роста опухоли, что указывает на то, что k1 и k2 могут быть более важными параметрами для дальнейшего изучения. Доля необъяснимой дисперсии показывает некоторую дисперсию при около t = 33, но график общей дисперсии показывает небольшую дисперсию при t = 33, что означает, что необъяснимая дисперсия может быть незначительной. Доля необъяснимой дисперсии вычисляется как 1 - (сумма всех индексов Соболя первого порядка), а общая дисперсия вычисляется с помощью var(response), где response является ответом модели в каждый момент времени.

Можно также отобразить значения чувствительности на гистограмме.

bar(sobolResults)

Figure contains an axes. The axes with title [Tumor Growth Model].tumor_weight contains 22 objects of type patch, line. These objects represent first order, total order.

Можно указать больше образцов для повышения точности индексов Соболя, но для завершения моделирования может потребоваться больше времени. Использовать addsamples для добавления дополнительных образцов. Например, если указано 1500 проб, функция выполняет 1500 * (2 + number of input parameters) моделирование.

gsaMoreSamples = addsamples(gsaResults,1500)

Свойство ReservateInfo объекта результата содержит различную информацию для вычисления индексов Соболь. Например, данные моделирования модели (SimData) для каждого моделирования с использованием набора выборок параметров хранятся в SimData поле свойства. Это поле представляет собой массив SimData объекты.

sobolResults.SimulationInfo.SimData
 
   SimBiology SimData Array : 1000-by-7
 
   Index:    Name:         ModelName:         DataCount: 
   1           -           Tumor Growth Model 1          
   2           -           Tumor Growth Model 1          
   3           -           Tumor Growth Model 1          
   ...                                                   
   7000        -           Tumor Growth Model 1          
 

Можно узнать, не удалось ли выполнить моделирование модели во время вычисления, проверив ValidSample поле SimulationInfo. В этом примере поле не показывает неудачных прогонов моделирования.

all(sobolResults.SimulationInfo.ValidSample)
ans = 1x7 logical array

   1   1   1   1   1   1   1

SimulationInfo.ValidSample - таблица логических значений. Он имеет тот же размер, что и SimulationInfo.SimData. Если ValidSample указывает на то, что при любом неудачном моделировании можно получить дополнительную информацию об этих прогонах моделирования и образцах, используемых для этих прогонов, путем извлечения информации из соответствующего столбца SimulationInfo.SimDatОтвет. Предположим, что четвертый столбец содержит один или несколько неудачных прогонов моделирования. Получение данных моделирования и значений образцов, используемых для этого моделирования, с помощью getSimulationResults.

[samplesUsed,sd,validruns] = getSimulationResults(sobolResults,4);

Можно добавлять пользовательские выражения в качестве наблюдаемых и вычислять индексы Соболя для добавляемых наблюдаемых. Например, можно вычислить индексы Соболя для максимального веса опухоли, определив пользовательское выражение следующим образом.

% Suppress an information warning that is issued during simulation.
warnSettings = warning('off', 'SimBiology:sbservices:SB_DIMANALYSISNOTDONE_MATLABFCN_UCON');
% Add the observable expression.
sobolObs = addobservable(sobolResults,'Maximum tumor_weight','max(tumor_weight)','Units','gram');

Постройте график вычисленных результатов моделирования, показывающих область квантиля 90%.

h2 = plotData(sobolObs);
h2.Position(:) = [100 100 1280 800];

Figure contains 2 axes. Axes 1 contains 12 objects of type line, patch. These objects represent model simulation, 90.0% region, mean value. Axes 2 contains 12 objects of type line, patch. These objects represent model simulation, 90.0% region, mean value.

Можно также удалить наблюдаемый объект, указав его имя.

gsaNoObs = removeobservable(sobolObs,'Maximum tumor_weight');

Восстановите параметры предупреждения.

warning(warnSettings);

Входные аргументы

свернуть все

Модель SimBiology, указанная как SimBiology model object.

Имена параметров модели, видов или отсеков, указанных как символьный вектор, строка, строковый вектор или массив ячеек символьных векторов.

Пример: ["k1","k2"]

Типы данных: char | string | cell

Отклики модели, заданные как символьный вектор, строка, строковый вектор или массив ячеек символьных векторов. Укажите названия видов, параметры, отделения или observables.

Пример: ["tumor_growth"]

Типы данных: char | string | cell

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: sobolResults = sbiosobol(modelObj,params,observables,'ShowWaitbar',true) указывает на отображение индикатора выполнения моделирования.

Границы параметров, указанные как разделенная запятыми пара, состоящая из 'Bounds' и числовую матрицу с двумя столбцами. Первый столбец содержит нижние границы, а второй столбец содержит верхние границы. Количество строк должно быть равно количеству параметров в params.

Если параметр имеет ненулевое значение, границы по умолчанию составляют ± 10% от значения. Если значение параметра равно нулю, границы по умолчанию: [0 1].

Пример: [0.5 5]

Типы данных: double

Дозы для использования во время моделирования модели, указанные как пара, разделенная запятыми, состоящая из 'Doses' и ScheduleDose или RepeatDose объект или вектор дозовых объектов.

Варианты для применения перед моделированием модели, указанные как разделенная запятыми пара, состоящая из 'Variants' и объект-вариант или вектор объектов-вариантов.

Если существует несколько исполнений и имеются повторяющиеся спецификации для значения свойства, во время моделирования используется последнее вхождение для значения свойства в массиве исполнений.

Количество выборок для вычисления индексов Соболя, указанных как разделенная запятыми пара, состоящая из 'NumberSamples' и положительное целое число. Функция требует (number of input params + 2) * NumberSamples моделирование для вычисления индексов Соболя первого и общего порядка.

Типы данных: double

Метод формирования выборок параметров, определяемый как разделенная запятыми пара, состоящая из 'SamplingMethod' и символьный вектор или строку. Допустимые параметры:

  • 'Sobol' - Используйте последовательность Соболя с низким несоответствием для генерации образцов.

  • 'Halton' - Используйте последовательность Халтона с низким несоответствием для генерации выборок.

  • 'lhs' - Используйте образцы латинского гиперкуба с низким несоответствием.

  • 'random' - Использовать равномерно распределенные случайные выборки.

Типы данных: char | string

Время остановки моделирования, указанное как пара, разделенная запятыми, состоящая из 'StopTime' и неотрицательный скаляр. Если не указано ни StopTime ни OutputTimes, функция использует время остановки из активного набора конфигурации модели. Вы не можете указать оба StopTime и OutputTimes.

Типы данных: double

Время вывода моделирования, указанное как пара, разделенная запятыми, состоящая из 'OutputTimes' и числовой вектор. Функция вычисляет индексы Соболя в эти выходные моменты времени. Вы не можете указать оба StopTime и OutputTimes. По умолчанию функция использует время вывода первого моделирования модели.

Пример: [0 1 2 3.5 4 5 5.5]

Типы данных: double

Флажок для параллельного выполнения моделирования модели, определяемый как разделенная запятыми пара, состоящая из 'UseParallel' и true или false.

Типы данных: logical

Флажок для включения ускорения модели, указанный как разделенная запятыми пара, состоящая из 'Accelerate' и true или false.

Типы данных: logical

Метод интерполяции моделирования модели к новому времени вывода, определяемый как разделенная запятыми пара, состоящая из 'InterpolationMethod' и символьный вектор или строку. Ниже приведены допустимые параметры.

  • "interp1q" - Использовать interp1q функция.

  • Используйте interp1 задав один из следующих методов:

    • "nearest"

    • "linear"

    • "spline"

    • "pchip"

    • "v5cubic"

  • "zoh" - Укажите удержание нулевого порядка.

Типы данных: char | string

Флаг для отображения хода моделирования модели путем отображения индикатора выполнения, указанного как пара, разделенная запятыми, состоящая из 'ShowWaitbar' и true или false. По умолчанию панель ожидания не отображается.

Типы данных: logical

Выходные аргументы

свернуть все

Результаты, содержащие индексы Соболя первого и общего порядка, возвращенные в виде SimBiology.gsa.Sobol объект. Объект также содержит значения выборки параметров и данные моделирования модели, используемые для вычисления индексов Соболя.

Объект результатов может содержать значительный объем данных моделирования (SimData). Размер объекта превышает (1 + number of observables) * number of output time points * (2 + number of parameters) * number of samples * 8 байт. Например, если имеется один наблюдаемый, 500 выходных моментов времени, 8 параметров и 100 000 выборок, размер объекта будет равен (1 + 1) * 500 * (2 + 8) * 100000 * 8 байт = 8 ГБ. Если необходимо сохранить такие большие объекты, используйте следующий синтаксис:

save(fileName,variableName,'-v7.3');
Дополнительные сведения см. в разделе Версия файла MAT.

Подробнее

свернуть все

Метод Сальтелли для вычисления индексов Соболя

sbiosobol реализует метод Сальтелли [1] для вычисления индексов Соболя.

Рассмотрим ответ модели SimBiology Y, выраженный как математическая модель Y = f (X1, X2, X3,..., Xk), где Xi является параметром модели иi = 1,…,k.

Индекс Соболя первого порядка (Si) дает долю общей дисперсии отклика V(Y) это можно объяснить вариациями только в Си. Si определяется следующим образом.

Si = VXi (EX∼i (Y 'Xi)) V (Y)

Суммарный индекс Соболя (STi) дает долю общей дисперсии отклика V(Y) которые могут быть приписаны любым вариациям совместных параметров, которые включают вариации Xi. STi определяется следующим образом.

STi=1−VX∼i (EXi (Y'X∼i)) V (Y) =EX∼i (VXi (Y'X∼i)) V (Y)

Чтобы вычислить отдельные значения для Y, соответствующие выборкам параметров X1, X1,..., Xk, рассмотрим две независимые матрицы выборки A и B.

A = (X11X12...X1kX21X22...X2k............Xn1Xn2...Xnk)

B = (X11' X12 '... X1k' X21' X22 '... X2k'............ Xn1' Xn2 '... Xnk')

n - размер выборки. Каждая строка матриц А и В соответствует одному набору выборок параметров, который является единой реализацией значений параметров модели.

Оценки для Si и STi получены из результатов моделирования модели с использованием значений выборки из матриц A, B и ABi, которая является матрицей, где все столбцы являются A, за исключением i-го столбца, который является B для i = 1, 2, …, params.

ABi = (X11X12... X1i '... X1kX21X22... X2i'... X2k.................. Xn1Xn2... Xni '... Xnk)

Формулы для аппроксимации индексов Соболя первого и общего порядка следующие.

S^i=1n∑j=1nf (B) j (f (ABi) j f (A) j) V (Y)

S^Ti=12n∑j=1n (f (A) j f (ABi) j) 2V (Y)

f(A), f(B)и f (ABi) j - результаты моделирования модели с использованием значений выборки параметров из матриц A, B и ABi.

Матрица A соответствует ParameterSamples свойство объекта результатов Соболь (resultsObj.ParameterSamples). Матрица B соответствует SupportSamples собственность (resultsObj.SimulationInfo.SupportSamples).

Матрицы ABi сохраняются в SimData структура SimulationInfo собственность (resultsObj.SimulationInfo.SimData). Размер SimulationInfo.SimData является NumberSamples-by-params + 2, где NumberSamples - количество выборок, а param - количество входных параметров. Количество столбцов: 2 + params потому что первый столбец SimulationInfo.SimData содержит результаты моделирования модели с использованием матрицы образцов A. Второй столбец содержит результаты моделирования с использованием SupportSamplesОстальные столбцы содержат результаты моделирования с использованием AB1, AB2,..., ABi,..., ABparams. ПосмотритеgetSimulationResults для извлечения результатов моделирования модели и выборок для указанного i-го индекса (ABi) из SimulationInfo.SimData массив.

Ссылки

[1] Сальтелли, Андреа, Паола Аннони, Ивано Адзини, Франческа Камполонго, Марко Ратто и Стефано Тарантола. "Анализ чувствительности выходных данных модели на основе дисперсии. Конструктор и оценщик для общего индекса чувствительности ". Компьютерная физика связи 181, № 2 (февраль 2010): 259-70. https://doi.org/10.1016/j.cpc.2009.09.018.

Представлен в R2020a