doxygen/modules/AdaptiveImportanceSampler_8C_source.html

 //* This file is part of the MOOSE framework
 //* https://mooseframework.inl.gov
 //*
 //* All rights reserved, see COPYRIGHT for full restrictions
 //* https://github.com/idaholab/moose/blob/master/COPYRIGHT
 //*
 //* Licensed under LGPL 2.1, please see LICENSE for details
 //* https://www.gnu.org/licenses/lgpl-2.1.html

 #include "AdaptiveImportanceSampler.h"
 #include "AdaptiveMonteCarloUtils.h"
 #include "Distribution.h"
 #include "Normal.h"
 #include "Uniform.h"

 registerMooseObjectAliased("StochasticToolsApp", AdaptiveImportanceSampler, "AdaptiveImportance");

 InputParameters
 AdaptiveImportanceSampler::validParams()
 {
   InputParameters params = Sampler::validParams();
   params.addClassDescription("Adaptive Importance Sampler.");
   params.addRequiredParam<std::vector<DistributionName>>(
       "distributions",
       "The distribution names to be sampled, the number of distributions provided defines the "
       "number of columns per matrix.");
   params.addRequiredParam<ReporterName>("inputs_reporter", "Reporter with input parameters.");
   params.addRequiredParam<std::vector<Real>>("proposal_std",
                                              "Standard deviations of the proposal distributions");
   params.addRequiredParam<Real>("output_limit", "Limiting values of the VPPs");
   params.addRequiredParam<std::vector<Real>>(
       "initial_values", "Initial input values to get the importance sampler started");
   params.addRequiredRangeCheckedParam<int>(
       "num_samples_train",
       "num_samples_train>0",
       "Number of samples to learn the importance distribution");
   params.addRequiredRangeCheckedParam<int>(
       "num_importance_sampling_steps",
       "num_importance_sampling_steps>0",
       "Number of importance sampling steps (after the importance distribution has been trained)");
   params.addRequiredParam<Real>(
       "std_factor", "Factor to be multiplied to the standard deviation of the importance samples");
   params.addParam<bool>("use_absolute_value", false, "Use absolute value of the sub app output");
   params.addParam<unsigned int>(
       "num_random_seeds",
       100000,
       "Initialize a certain number of random seeds. Change from the default only if you have to.");
   params.addParam<ReporterName>("flag_sample",
                                 "Flag samples if the surrogate prediction was inadequate.");
   return params;
 }

 AdaptiveImportanceSampler::AdaptiveImportanceSampler(const InputParameters & parameters)
   : Sampler(parameters),
     TransientInterface(this),
     _proposal_std(getParam<std::vector<Real>>("proposal_std")),
     _initial_values(getParam<std::vector<Real>>("initial_values")),
     _output_limit(getParam<Real>("output_limit")),
     _num_samples_train(getParam<int>("num_samples_train")),
     _num_importance_sampling_steps(getParam<int>("num_importance_sampling_steps")),
     _std_factor(getParam<Real>("std_factor")),
     _use_absolute_value(getParam<bool>("use_absolute_value")),
     _num_random_seeds(getParam<unsigned int>("num_random_seeds")),
     _is_sampling_completed(false),
     _inputs(getReporterValue<std::vector<std::vector<Real>>>("inputs_reporter")),
     _retraining_steps(0),
     _gp_flag(isParamValid("flag_sample") ? &getReporterValue<std::vector<bool>>("flag_sample")
                                          : nullptr)
 {
   // Filling the `distributions` vector with the user-provided distributions.
   for (const DistributionName & name : getParam<std::vector<DistributionName>>("distributions"))
     _distributions.push_back(&getDistributionByName(name));

   /* Adaptive Importance Sampling (AdaptiveImportanceSampler) relies on a Markov Chain Monte Carlo
      (MCMC) algorithm. As such, in MOOSE, any use of MCMC algorithms requires that the `num_steps`
      parameter in the main App's executioner would control the total number of samples. Therefore,
      the `num_rows` parameter typically used by exisiting non-MCMC samplers to set the total number
      of samples has no use here and is fixed to 1.*/
   setNumberOfRows(1);

   // Setting the number of columns in the sampler matrix (equal to the number of distributions).
   setNumberOfCols(_distributions.size());

   /* `inputs_sto` is a member variable that aids in forming the importance distribution.
      One dimension of this variable is equal to the number of distributions. The other dimension
      of the variable, at the last step, is equal to the number of samples the user desires.*/
   _inputs_sto.resize(_distributions.size());

   // Mapping all the input distributions to a standard normal space
   for (unsigned int i = 0; i < _distributions.size(); ++i)
     _inputs_sto[i].push_back(Normal::quantile(_distributions[i]->cdf(_initial_values[i]), 0, 1));

   /* `prev_value` is a member variable for tracking the previously accepted samples in the
      MCMC algorithm and proposing the next sample.*/
   _prev_value.resize(_distributions.size());

   // `check_step` is a member variable for ensuring that the MCMC algorithm proceeds in a sequential
   // fashion.
   _check_step = 0;

   // Storage for means of input values for proposing the next sample
   _mean_sto.resize(_distributions.size());

   // Storage for standard deviations of input values for proposing the next sample
   _std_sto.resize(_distributions.size());

   setNumberOfRandomSeeds(_num_random_seeds);
 }

 Real
 AdaptiveImportanceSampler::computeSample(dof_id_type /*row_index*/, dof_id_type col_index)
 {
   const bool sample = _t_step > 1 && col_index == 0 && _check_step != _t_step;
   const bool gp_flag = _gp_flag ? (*_gp_flag)[0] : false;

   if (sample && _is_sampling_completed)
     mooseError("Internal bug: the adaptive sampling is supposed to be completed but another sample "
                "has been requested.");

   if (_t_step <= _num_samples_train)
   {
     /* This is the importance distribution training step. Markov Chains are set up
       to sample from the importance region or the failure region using the Metropolis
       algorithm. Given that the previous sample resulted in a model failure, the next
       sample is proposed such that it is very likely to result in a model failure as well.
       The `initial_values` and `proposal_std` parameters provided by the user affects the
       formation of the importance distribution. */
     if (sample && !gp_flag)
     {
       for (dof_id_type j = 0; j < _distributions.size(); ++j)
         _prev_value[j] = Normal::quantile(_distributions[j]->cdf(_inputs[j][0]), 0.0, 1.0);
       Real acceptance_ratio = 0.0;
       for (dof_id_type i = 0; i < _distributions.size(); ++i)
         acceptance_ratio += std::log(Normal::pdf(_prev_value[i], 0.0, 1.0)) -
                             std::log(Normal::pdf(_inputs_sto[i].back(), 0.0, 1.0));
       if (acceptance_ratio > std::log(getRand(_t_step)))
       {
         for (dof_id_type i = 0; i < _distributions.size(); ++i)
           _inputs_sto[i].push_back(_prev_value[i]);
       }
       else
       {
         for (dof_id_type i = 0; i < _distributions.size(); ++i)
           _inputs_sto[i].push_back(_inputs_sto[i].back());
       }
       for (dof_id_type i = 0; i < _distributions.size(); ++i)
         _prev_value[i] =
             Normal::quantile(getRand(_t_step), _inputs_sto[i].back(), _proposal_std[i]);
     }
   }
   else if (sample && !gp_flag)
   {
     /* This is the importance sampling step using the importance distribution created
       in the previous step. Once the importance distribution is known, sampling from
       it is similar to a regular Monte Carlo sampling. */
     for (dof_id_type i = 0; i < _distributions.size(); ++i)
     {
       if (_t_step == _num_samples_train + 1)
       {
         _mean_sto[i] = AdaptiveMonteCarloUtils::computeMean(_inputs_sto[i], 1);
         _std_sto[i] = AdaptiveMonteCarloUtils::computeSTD(_inputs_sto[i], 1);
       }
       _prev_value[i] =
           (Normal::quantile(getRand(_t_step), _mean_sto[i], _std_factor * _std_sto[i]));
     }

     // check if we have performed all the importance sampling steps
     if (_t_step >= _num_samples_train + _num_importance_sampling_steps + _retraining_steps)
       _is_sampling_completed = true;
   }

   // When the GP fails, the current time step is 'wasted' and the retraining step doesn't
   // happen until the next time step. Therefore, keep track of the number of retraining steps
   // to increase the total number of steps taken.
   if (sample && gp_flag && _t_step > _num_samples_train)
     ++_retraining_steps;

   _check_step = _t_step;
   return _distributions[col_index]->quantile(Normal::cdf(_prev_value[col_index], 0.0, 1.0));
 }
Sampler::setNumberOfRows
void setNumberOfRows(dof_id_type n_rows)

AdaptiveImportanceSampler::_retraining_steps
int _retraining_steps
Number of retraining performed.
Definition: AdaptiveImportanceSampler.h:108

InputParameters::addRequiredRangeCheckedParam
void addRequiredRangeCheckedParam(const std::string &name, const std::string &parsed_function, const std::string &doc_string)

AdaptiveImportanceSampler::_check_step
int _check_step
Ensure that the MCMC algorithm proceeds in a sequential fashion.
Definition: AdaptiveImportanceSampler.h:93

Normal::cdf
virtual Real cdf(const Real &x) const override
Definition: Normal.C:74

Sampler::validParams
static InputParameters validParams()

InputParameters::addParam
void addParam(const std::string &name, const std::initializer_list< typename T::value_type > &value, const std::string &doc_string)

Sampler

AdaptiveImportanceSampler
A class used to perform Adaptive Importance Sampling using a Markov Chain Monte Carlo algorithm...
Definition: AdaptiveImportanceSampler.h:18

AdaptiveImportanceSampler::_is_sampling_completed
bool _is_sampling_completed
True if the sampling is completed.
Definition: AdaptiveImportanceSampler.h:86

AdaptiveImportanceSampler::_distributions
std::vector< const Distribution * > _distributions
Storage for distribution objects to be utilized.
Definition: AdaptiveImportanceSampler.h:59

std

AdaptiveImportanceSampler::computeSample
virtual Real computeSample(dof_id_type row_index, dof_id_type col_index) override
Return the sample for the given row (the sample index) and column (the parameter index) ...
Definition: AdaptiveImportanceSampler.C:111

AdaptiveImportanceSampler::_inputs_sto
std::vector< std::vector< Real > > _inputs_sto
Storage for previously accepted samples by the decision reporter system.
Definition: AdaptiveImportanceSampler.h:105

AdaptiveMonteCarloUtils::computeMean
Real computeMean(const std::vector< Real > &data, const unsigned int &start_index)
compute the mean of a data vector by only considering values from a specific index.
Definition: AdaptiveMonteCarloUtils.C:38

Sampler::getRand
Real getRand(unsigned int index=0)

Sampler::name
virtual const std::string & name() const

AdaptiveImportanceSampler::_inputs
const std::vector< std::vector< Real > > & _inputs
Storage for the inputs vector obtained from the reporter.
Definition: AdaptiveImportanceSampler.h:90

InputParameters::addRequiredParam
void addRequiredParam(const std::string &name, const std::string &doc_string)

Normal::pdf
virtual Real pdf(const Real &x) const override
Definition: Normal.C:68

AdaptiveImportanceSampler::_std_sto
std::vector< Real > _std_sto
Storage for standard deviations of input values for proposing the next sample.
Definition: AdaptiveImportanceSampler.h:102

AdaptiveImportanceSampler::AdaptiveImportanceSampler
AdaptiveImportanceSampler(const InputParameters &parameters)
Definition: AdaptiveImportanceSampler.C:53

TransientInterface

InputParameters

TransientInterface::_t_step
int & _t_step

AdaptiveImportanceSampler::_num_samples_train
const int & _num_samples_train
Number of samples to train the importance sampler.
Definition: AdaptiveImportanceSampler.h:71

AdaptiveImportanceSampler::_num_random_seeds
const unsigned int & _num_random_seeds
Initialize a certain number of random seeds. Change from the default only if you have to...
Definition: AdaptiveImportanceSampler.h:83

Uniform.h

Sampler::getParam
const T & getParam(const std::string &name) const

Distribution.h

AdaptiveImportanceSampler::_num_importance_sampling_steps
const int & _num_importance_sampling_steps
Number of importance sampling steps (after the importance distribution has been trained) ...
Definition: AdaptiveImportanceSampler.h:74

registerMooseObjectAliased
registerMooseObjectAliased("StochasticToolsApp", AdaptiveImportanceSampler, "AdaptiveImportance")

AdaptiveMonteCarloUtils::computeSTD
Real computeSTD(const std::vector< Real > &data, const unsigned int &start_index)
compute the standard deviation of a data vector by only considering values from a specific index...
Definition: AdaptiveMonteCarloUtils.C:21

AdaptiveImportanceSampler::_std_factor
const Real & _std_factor
Factor to be multiplied to the standard deviation of the proposal distribution.
Definition: AdaptiveImportanceSampler.h:77

Sampler::getDistributionByName
const Distribution & getDistributionByName(const DistributionName &name) const

AdaptiveImportanceSampler::_mean_sto
std::vector< Real > _mean_sto
Storage for means of input values for proposing the next sample.
Definition: AdaptiveImportanceSampler.h:99

Real
DIE A HORRIBLE DEATH HERE typedef LIBMESH_DEFAULT_SCALAR_TYPE Real

Sampler::setNumberOfCols
void setNumberOfCols(dof_id_type n_cols)

AdaptiveImportanceSampler.h

AdaptiveImportanceSampler::_gp_flag
const std::vector< bool > *const _gp_flag
Indicate whether GP prediction is good or bad to influence next proposed sample.
Definition: AdaptiveImportanceSampler.h:111

Sampler::mooseError
void mooseError(Args &&... args) const

InputParameters::addClassDescription
void addClassDescription(const std::string &doc_string)

AdaptiveImportanceSampler::_initial_values
const std::vector< Real > & _initial_values
Initial values values vector to start the importance sampler.
Definition: AdaptiveImportanceSampler.h:65

EM::j
static const std::complex< double > j(0, 1)
Complex number "j" (also known as "i")

AdaptiveImportanceSampler::_proposal_std
const std::vector< Real > & _proposal_std
The proposal distribution standard deviations.
Definition: AdaptiveImportanceSampler.h:62

AdaptiveImportanceSampler::validParams
static InputParameters validParams()
Definition: AdaptiveImportanceSampler.C:19

Normal.h

Normal::quantile
virtual Real quantile(const Real &p) const override
Definition: Normal.C:80

AdaptiveMonteCarloUtils.h

int
void ErrorVector unsigned int

ReporterName

dof_id_type
uint8_t dof_id_type

AdaptiveImportanceSampler::_prev_value
std::vector< Real > _prev_value
For proposing the next sample in the MCMC algorithm.
Definition: AdaptiveImportanceSampler.h:96

Sampler::setNumberOfRandomSeeds
void setNumberOfRandomSeeds(std::size_t number)