Управление генерацией случайных чисел

В этом примере показано, как использовать rng функция, которая обеспечивает управление генерацией случайных чисел.

(Псевдо) Случайные числа в MATLAB прибывают из randrandi, и randn функции. Много других функций вызывают те три, но те - основные базовые блоки. Все три зависят от одного разделяемого генератора случайных чисел, что можно управлять использованием rng.

Важно понять, что "случайные" числа в MATLAB весьма предсказуемы вообще, но сгенерированы детерминированным алгоритмом. Алгоритм спроектирован, чтобы быть достаточно сложным так, чтобы его выход, казалось, был независимой случайной последовательностью кому-то, кто не знает алгоритм и может пройти различные статистические тесты случайности. Функция, которая введена здесь, обеспечивает способы использовать в своих интересах детерминизм к

  • повторите вычисления, которые включают случайные числа и получают те же результаты, или

  • гарантируйте, что различные случайные числа используются в повторных вычислениях

и использовать в своих интересах очевидную случайность, чтобы выровнять по ширине объединяющиеся результаты отдельных вычислений.

"Запуск"

Если вы смотрите на выход от randrandi, или randn в новом сеансе работы с MATLAB вы заметите, что они возвращают те же последовательности чисел каждый раз, когда вы перезапускаете MATLAB. Часто полезно смочь сбросить генератор случайных чисел к тому состоянию запуска, на самом деле не перезапуская MATLAB. Например, вы можете хотеть повторить вычисление, которое включает случайные числа, и получите тот же результат.

rng обеспечивает очень простой способ отложить генератор случайных чисел к его настройкам по умолчанию.

rng default
rand % returns the same value as at startup
ans = 0.8147

Что является настройками случайных чисел "по умолчанию", которые MATLAB запускает с, или тот rng default дает вам? Если вы вызываете rng без входных параметров вы видите, что это - алгоритм Генератора случайных чисел Вихрь Мерсенна, отобранный с 0.

rng
ans = struct with fields:
     Type: 'twister'
     Seed: 0
    State: [625x1 uint32]

Вы будете видеть более подробно ниже, как использовать вышеупомянутый выход, включая State поле, чтобы управлять и измениться, как MATLAB генерирует случайные числа. На данный момент это служит способом видеть что генератор randrandi, и randn в настоящее время используют.

Невоспроизводимость

Каждый раз вы вызываете randrandi, или randn, они чертят новое значение от своего разделяемого генератора случайных чисел, и последовательные значения могут быть обработаны как статистически независимые. Но, как упомянуто выше, каждый раз, когда вы перезапускаете MATLAB, те функции сбрасываются и возвращают те же последовательности чисел. Очевидно, вычисления, которые используют те же "случайные" числа, не могут думаться как статистически независимые. Таким образом, когда необходимо объединить вычисления, сделанные в двух или больше сеансах работы с MATLAB, как будто они были статистически независимы, вы не можете использовать настройки генератора по умолчанию.

Один простой способ постараться не повторять те же случайные числа в новом сеансе работы с MATLAB состоит в том, чтобы выбрать различный seed для генератора случайных чисел. rng дает вам простой способ сделать это, путем создания seed на основе текущего времени.

rng shuffle
rand
ans = 0.7965

Каждый раз вы используете 'shuffle', это пересевает генератор с различным seed. Можно вызвать rng без входных параметров, чтобы видеть, что отбирает его на самом деле используемый.

rng
ans = struct with fields:
     Type: 'twister'
     Seed: 1688988678
    State: [625x1 uint32]

rng shuffle % creates a different seed each time
rng
ans = struct with fields:
     Type: 'twister'
     Seed: 1688988681
    State: [625x1 uint32]

rand
ans = 0.1941

'shuffle' очень простой способ состоит в том, чтобы пересеять генератор случайных чисел. Вы можете думать, что это - хорошая идея, или даже необходимый, чтобы использовать его, чтобы получить "истинную" случайность в MATLAB. В большинстве целей, тем не менее, не необходимо использовать 'shuffle' вообще. Выбор seed на основе текущего времени не улучшает статистические свойства значений, которые вы получите от randrandi, и randn, и не делает их "более случайными" ни в каком действительном смысле. В то время как это прекрасно подходит, чтобы пересеять генератор каждый раз, когда вы запускаете MATLAB, или прежде чем вы выполните некоторое большое вычисление, включающее случайные числа, это - на самом деле не хорошая идея пересевать генератор слишком часто в сеансе, потому что это может влиять на статистические свойства ваших случайных чисел.

Что 'shuffle' действительно обеспечивает способ постараться не повторять те же последовательности значений. Иногда это очень важно, иногда это только "хорошо", но часто это не важно вообще. Примите во внимание это, если вы используете 'shuffle', можно хотеть сохранить seed что rng созданный так, чтобы можно было повторить вычисления позже. Вы будете видеть, как сделать это ниже.

Больше управления воспроизводимостью и невоспроизводимостью

До сих пор вы видели, как сбросить генератор случайных чисел к его настройкам по умолчанию и пересеять его с помощью seed, который создается с помощью текущего времени. rng также обеспечивает способ пересеять его с помощью определенного seed.

Можно несколько раз использовать тот же seed, чтобы повторить те же вычисления. Например, если вы запускаете этот код дважды...

rng(1) % the seed is any non-negative integer < 2^32
x = randn(1,5)
x = 1×5

   -0.6490    1.1812   -0.7585   -1.1096   -0.8456

rng(1)
x = randn(1,5)
x = 1×5

   -0.6490    1.1812   -0.7585   -1.1096   -0.8456

... вы получаете точно те же результаты. Вы можете сделать это, чтобы воссоздать x очистив это, так, чтобы можно было повторить то, что происходит в последующих вычислениях, которые зависят от x, использование тех определенных значений.

С другой стороны, вы можете хотеть выбрать различные seed, чтобы гарантировать, что вы не повторяете те же вычисления. Например, если вы запускаете этот код в одном сеансе работы с MATLAB...

rng(2)
x2 = sum(randn(50,1000),1); % 1000 trials of a random walk

и этот код в другом...

rng(3)
x3 = sum(randn(50,1000),1);

... вы могли объединить два результата и быть уверены, что они не просто те же результаты, повторенные дважды.

x = [x2 x3];

Как с 'shuffle' существует протест при пересеве генератора случайных чисел MATLAB, потому что это влияет на весь последующий выход от randrandi, и randn. Если вам не нужны воспроизводимость или уникальность, обычно желательно просто сгенерировать случайные значения, не пересевая генератор. Если действительно необходимо пересеять генератор, который обычно лучше всего делается в командной строке, или в месте в коде, который легко не пропущен.

Выбор типа генератора

Мало того, что можно пересеять генератор случайных чисел как показано выше, можно также выбрать тип генератора случайных чисел, который вы хотите использовать. Различные типы генератора производят различные последовательности случайных чисел, и вы можете, например, выбрать определенный тип из-за его статистических свойств. Или вы можете должны быть воссоздать результаты более старой версии MATLAB, который использовал различный тип генератора по умолчанию.

Еще одна общая причина выбора типа генератора состоит в том, что вы пишете тест валидации, который генерирует "случайные" входные данные, и необходимо гарантировать, что тест может всегда ожидать точно тот же предсказуемый результат. Если вы вызываете rng с seed прежде, чем создать входные данные, это пересевает генератор случайных чисел. Но если тип генератора был изменен по некоторым причинам, то выход от randrandi, и randn не будет тем, что вы ожидаете от того seed. Поэтому, чтобы быть на 100% уверенными в воспроизводимости, можно также задать тип генератора.

Например,

rng(0,'twister')

причины randrandi, и randn использовать алгоритм Генератора случайных чисел Вихрь Мерсенна, после отбора это с 0.

Используя 'combRecursive'

rng(0,'combRecursive')

выбирает Объединенное Несколько Рекурсивный алгоритм генератора, который поддерживает некоторые параллельные функции, которые не делает Вихрь Мерсенна.

Эта команда

rng(0,'v4')

выбирает алгоритм генератора, который был значением по умолчанию в MATLAB 4.0.

И конечно, эта команда возвращает генератор случайных чисел в свои настройки по умолчанию.

rng default

Однако, потому что настройки генератора случайных чисел по умолчанию могут измениться между релизами MATLAB, с помощью 'default' не гарантирует предсказуемые результаты по долгосрочному. 'default' удобный способ состоит в том, чтобы сбросить генератор случайных чисел, но еще для большей предсказуемости, задать тип генератора и seed.

С другой стороны, когда вы работаете в интерактивном режиме и нуждаетесь в воспроизводимости, это более просто, и обычно достаточно, чтобы вызвать rng с только seed.

Сохранение и восстановление настроек генератора случайных чисел

Вызов rng без входных параметров возвращает скалярную структуру с полями, которые уже содержат два данные, описанные: тип генератора и целое число, с которым был в последний раз пересеян генератор.

s = rng
s = struct with fields:
     Type: 'twister'
     Seed: 0
    State: [625x1 uint32]

Третье поле, State, содержит копию вектора текущего состояния генератора. Этот вектор состояния является информацией, которую генератор обеспечивает внутренне для того, чтобы сгенерировать следующее значение в его последовательности случайных чисел. Каждый раз вы вызываете randrandi, или randn, генератор, который они совместно используют, обновляет свое внутреннее состояние. Таким образом, вектор состояния в структуре настроек, возвращенной rng содержит информацию, необходимую, чтобы повторить последовательность, начинающуюся с точки, в которой было получено состояние.

В то время как только способность видеть этот выход информативна, rng также принимает структуру настроек как вход, так, чтобы можно было сохранить настройки, включая вектор состояния, и восстановить их позже, чтобы повторить вычисления. Поскольку настройки содержат тип генератора, вы будете знать точно, что вы получаете, и поэтому "более поздняя" сила означает что-либо от несколько моментов спустя в том же сеансе работы с MATLAB к годам (и несколько релизов MATLAB) позже. Можно повторить результаты любой точки в последовательности случайных чисел, в которой вы сохранили настройки генератора. Например,

x1 = randn(10,10); % move ahead in the random number sequence
s = rng;           % save the settings at this point
x2 = randn(1,5)
x2 = 1×5

    0.8404   -0.8880    0.1001   -0.5445    0.3035

x3 = randn(5,5);   % move ahead in the random number sequence
rng(s);            % return the generator back to the saved state
x2 = randn(1,5)    % repeat the same numbers
x2 = 1×5

    0.8404   -0.8880    0.1001   -0.5445    0.3035

Заметьте, что, в то время как пересев обеспечивает только крупную реинициализацию, сохраняя и восстанавливая состояние генератора, использование структуры настроек позволяет вам повторять любую часть последовательности случайных чисел.

Наиболее распространенный способ использовать структуру настроек состоит в том, чтобы восстановить состояние генератора. Однако, потому что структура содержит не только состояние, но также и тип генератора и seed, это - также удобный способ временно переключить типы генератора. Например, если необходимо создать стоимость с помощью одного из устаревших генераторов от MATLAB 5.0, можно сохранить текущие настройки в то же самое время, когда вы переключаетесь, чтобы использовать старый генератор...

previousSettings = rng(0,'v5uniform')
previousSettings = struct with fields:
     Type: 'twister'
     Seed: 0
    State: [625x1 uint32]

... и затем восстановите исходные настройки позже.

rng(previousSettings)

Вы не должны изменять содержимое ни одного из полей в структуре настроек. В частности, вы не должны создавать свой собственный вектор состояния, или даже зависеть от формата состояния генератора.

Пишущий более простой, более гибкий, код

rng позволяет вам также

  • пересейте генератор случайных чисел, или

  • сохраните и восстановите настройки генератора случайных чисел

не имея необходимость знать то, что вводит его. Можно также возвратить генератор случайных чисел в его настройки по умолчанию, не имея необходимость знать, каковы те настройки. В то время как существуют ситуации, когда вы можете хотеть задать тип генератора, rng предоставляет вам простоту не необходимости задать его.

Если вы сможете постараться не задавать тип генератора, ваш код автоматически адаптируется к случаям, где различный генератор должен использоваться и автоматически извлечет выгоду из улучшенных свойств в новом типе генератора случайных чисел по умолчанию.

rng и RandStream

rng обеспечивает удобный способ управлять генерацией случайных чисел в MATLAB для наиболее распространенных потребностей. Однако более сложные ситуации, включающие несколько потоков случайных чисел и параллельной генерации случайных чисел, требуют более сложного инструмента. RandStream класс - то, что инструмент, и это обеспечивает самый мощный способ управлять генерацией случайных чисел. Эти два инструмента дополнительны с rng обеспечение намного более простого и краткого синтаксиса, который создается сверх гибкости RandStream.