Реализуйте Bootstrap с использованием параллельных вычислений

Bootstrap в последовательной и параллельной

Вот пример, когда bootstrap параллельно или последовательно. Пример генерирует данные из смеси двух Гауссов, создает непараметрическую оценку полученных данных и использует загрузочный ремень, чтобы получить представление о изменчивости дискретизации.

  1. Сгенерируйте данные:

    % Generate a random sample of size 1000,
    % from a mixture of two Gaussian distributions 
    x = [randn(700,1); 4 + 2*randn(300,1)];
  2. Создайте непараметрическую оценку плотности из данных:

    latt = -4:0.01:12;
    myfun = @(X) ksdensity(X,latt); 
    pdfestimate = myfun(x);
  3. Загрузите оценку, чтобы получить представление о ее изменчивости дискретизации. Запустите загрузочный ремень последовательно для сравнения временных параметров.

    tic;B = bootstrp(200,myfun,x);toc
    
    Elapsed time is 10.878654 seconds.
  4. Запустите загрузочный ремень параллельно для сравнения временных параметров:

    mypool = parpool()
    Starting parpool using the 'local' profile ... connected to 2 workers.
    
    mypool = 
    
      Pool with properties:
    
        AttachedFiles: {0x1 cell}
           NumWorkers: 2
          IdleTimeout: 30
              Cluster: [1x1 parallel.cluster.Local]
         RequestQueue: [1x1 parallel.RequestQueue]
          SpmdEnabled: 1
    
    opt = statset('UseParallel',true);
    tic;B = bootstrp(200,myfun,x,'Options',opt);toc
    
    Elapsed time is 6.304077 seconds.

    Параллельные вычисления почти в два раза быстрее, чем последовательные вычисления для этого примера.

Наложите ksdensity оценка плотности с 200 загрузочными оценками, полученными в параллельном загрузочном ремешке. Вы можете получить представление о том, как оценить точность оценки плотности с этого графика.

hold on
for i=1:size(B,1),
    plot(latt,B(i,:),'c:')
end
plot(latt,pdfestimate);
xlabel('x');ylabel('Density estimate')

Воспроизводимый параллельный Bootstrap

Чтобы запустить пример параллельно воспроизводимым образом, установите опции соответствующим образом (см. «Выполнение воспроизводимых параллельных расчетов»). Сначала настройте задачу и параллельное окружение как в Bootstrap в последовательных и параллельных. Затем установите опции для использования субпотоков наряду с потоком, который поддерживает субпотоки.

s = RandStream('mlfg6331_64'); % has substreams
opts = statset('UseParallel',true,...
    'Streams',s,'UseSubstreams',true);
B2 = bootstrp(200,myfun,x,'Options',opts);

Чтобы перезапустить bootstrap и получить тот же результат:

reset(s) % set the stream to initial state
B3 = bootstrp(200,myfun,x,'Options',opts);
isequal(B2,B3) % check if same results

ans =
     1