doxygen/modules/GaussianProcessTrainer_8C_source.html

 //* This file is part of the MOOSE framework
 //* https://mooseframework.inl.gov
 //*
 //* All rights reserved, see COPYRIGHT for full restrictions
 //* https://github.com/idaholab/moose/blob/master/COPYRIGHT
 //*
 //* Licensed under LGPL 2.1, please see LICENSE for details
 //* https://www.gnu.org/licenses/lgpl-2.1.html

 #include "GaussianProcessTrainer.h"
 #include "Sampler.h"
 #include "CartesianProduct.h"

 #include <petsctao.h>
 #include <petscdmda.h>

 #include "libmesh/petsc_vector.h"
 #include "libmesh/petsc_matrix.h"

 #include <cmath>

 registerMooseObject("StochasticToolsApp", GaussianProcessTrainer);

 InputParameters
 GaussianProcessTrainer::validParams()
 {
   InputParameters params = SurrogateTrainer::validParams();
   params.addClassDescription("Provides data preperation and training for a single- or multi-output "
                              "Gaussian Process surrogate model.");

   params.addRequiredParam<UserObjectName>("covariance_function", "Name of covariance function.");
   params.addParam<bool>(
       "standardize_params", true, "Standardize (center and scale) training parameters (x values)");
   params.addParam<bool>(
       "standardize_data", true, "Standardize (center and scale) training data (y values)");
   // Already preparing to use Adam here
   params.addParam<unsigned int>("num_iters", 1000, "Tolerance value for Adam optimization");
   params.addParam<unsigned int>("batch_size", 0, "The batch size for Adam optimization");
   params.addParam<Real>("learning_rate", 0.001, "The learning rate for Adam optimization");
   params.addParam<unsigned int>(
       "show_every_nth_iteration",
       0,
       "Switch to show Adam optimization loss values at every nth step. If 0, nothing is showed.");
   params.addParam<std::vector<std::string>>("tune_parameters",
                                             "Select hyperparameters to be tuned");
   params.addParam<std::vector<Real>>("tuning_min", "Minimum allowable tuning value");
   params.addParam<std::vector<Real>>("tuning_max", "Maximum allowable tuning value");
   return params;
 }

 GaussianProcessTrainer::GaussianProcessTrainer(const InputParameters & parameters)
   : SurrogateTrainer(parameters),
     CovarianceInterface(parameters),
     _predictor_row(getPredictorData()),
     _gp(declareModelData<StochasticTools::GaussianProcess>("_gp")),
     _training_params(declareModelData<RealEigenMatrix>("_training_params")),
     _standardize_params(getParam<bool>("standardize_params")),
     _standardize_data(getParam<bool>("standardize_data")),
     _do_tuning(isParamValid("tune_parameters")),
     _optimization_opts(StochasticTools::GaussianProcess::GPOptimizerOptions(
         getParam<unsigned int>("show_every_nth_iteration"),
         getParam<unsigned int>("num_iters"),
         getParam<unsigned int>("batch_size"),
         getParam<Real>("learning_rate"))),
     _sampler_row(getSamplerData())
 {
   // Error Checking
   if (parameters.isParamSetByUser("batch_size"))
     if (_sampler.getNumberOfRows() < _optimization_opts.batch_size)
       paramError("batch_size", "Batch size cannot be greater than the training data set size.");

   std::vector<std::string> tune_parameters(
       _do_tuning ? getParam<std::vector<std::string>>("tune_parameters")
                  : std::vector<std::string>{});

   if (isParamValid("tuning_min") &&
       (getParam<std::vector<Real>>("tuning_min").size() != tune_parameters.size()))
     mooseError("tuning_min size does not match tune_parameters");
   if (isParamValid("tuning_max") &&
       (getParam<std::vector<Real>>("tuning_max").size() != tune_parameters.size()))
     mooseError("tuning_max size does not match tune_parameters");

   std::vector<Real> lower_bounds, upper_bounds;
   if (isParamValid("tuning_min"))
     lower_bounds = getParam<std::vector<Real>>("tuning_min");
   if (isParamValid("tuning_max"))
     upper_bounds = getParam<std::vector<Real>>("tuning_max");

   _gp.initialize(getCovarianceFunctionByName(parameters.get<UserObjectName>("covariance_function")),
                  tune_parameters,
                  lower_bounds,
                  upper_bounds);

   _n_outputs = _gp.getCovarFunction().numOutputs();
 }

 void
 GaussianProcessTrainer::preTrain()
 {
   _params_buffer.clear();
   _data_buffer.clear();
   _params_buffer.reserve(getLocalSampleSize());
   _data_buffer.reserve(getLocalSampleSize());
 }

 void
 GaussianProcessTrainer::train()
 {
   _params_buffer.push_back(_predictor_row);

   if (_rvecval && _rvecval->size() != _n_outputs)
     mooseError("The size of the provided response (",
                _rvecval->size(),
                ") does not match the number of expected outputs from the covariance (",
                _n_outputs,
                ")!");

   _data_buffer.push_back(_rvecval ? (*_rvecval) : std::vector<Real>(1, *_rval));
 }

 void
 GaussianProcessTrainer::postTrain()
 {
   // Instead of gatherSum, we have to allgather.
   _communicator.allgather(_params_buffer);
   _communicator.allgather(_data_buffer);

   _training_params.resize(_params_buffer.size(), _n_dims);
   _training_data.resize(_data_buffer.size(), _n_outputs);

   for (auto ii : make_range(_training_params.rows()))
   {
     for (auto jj : make_range(_n_dims))
       _training_params(ii, jj) = _params_buffer[ii][jj];
     for (auto jj : make_range(_n_outputs))
       _training_data(ii, jj) = _data_buffer[ii][jj];
   }

   // Standardize (center and scale) training params
   if (_standardize_params)
     _gp.standardizeParameters(_training_params);
   // if not standardizing data set mean=0, std=1 for use in surrogate
   else
     _gp.paramStandardizer().set(0, 1, _n_dims);

   // Standardize (center and scale) training data
   if (_standardize_data)
     _gp.standardizeData(_training_data);
   // if not standardizing data set mean=0, std=1 for use in surrogate
   else
     _gp.dataStandardizer().set(0, 1, _n_outputs);

   // Setup the covariance
   _gp.setupCovarianceMatrix(_training_params, _training_data, _optimization_opts);
 }
GaussianProcessTrainer::_optimization_opts
const StochasticTools::GaussianProcess::GPOptimizerOptions _optimization_opts
Struct holding parameters necessary for parameter tuning.
Definition: GaussianProcessTrainer.h:64

GaussianProcessTrainer.h

libMesh::Parallel::Communicator::allgather
void allgather(const T &send_data, std::vector< T, A > &recv_data) const

StochasticTools::GaussianProcess::setupCovarianceMatrix
void setupCovarianceMatrix(const RealEigenMatrix &training_params, const RealEigenMatrix &training_data, const GPOptimizerOptions &opts)
Sets up the covariance matrix given data and optimization options.
Definition: GaussianProcess.C:70

CovarianceInterface
Definition: CovarianceInterface.h:17

GaussianProcessTrainer::train
virtual void train() override
Definition: GaussianProcessTrainer.C:107

CartesianProduct.h

SurrogateTrainer::_rval
const Real * _rval
Response value.
Definition: SurrogateTrainer.h:125

SurrogateTrainer::_n_dims
unsigned int _n_dims
Dimension of predictor data - either _sampler.getNumberOfCols() or _pvals.size() + _pcols...
Definition: SurrogateTrainer.h:133

InputParameters::addParam
void addParam(const std::string &name, const std::initializer_list< typename T::value_type > &value, const std::string &doc_string)

InputParameters::get
std::vector< std::pair< R1, R2 > > get(const std::string &param1, const std::string &param2) const

SurrogateTrainer::_rvecval
const std::vector< Real > * _rvecval
Vector response value.
Definition: SurrogateTrainer.h:127

StochasticTools::GaussianProcess::getCovarFunction
const CovarianceFunctionBase & getCovarFunction() const
Definition: GaussianProcess.h:177

GaussianProcessTrainer::_training_params
RealEigenMatrix & _training_params
Paramaters (x) used for training, along with statistics.
Definition: GaussianProcessTrainer.h:49

GaussianProcessTrainer
Definition: GaussianProcessTrainer.h:23

libMesh::ParallelObject::_communicator
const Parallel::Communicator & _communicator

StochasticTools::GaussianProcess::standardizeData
void standardizeData(RealEigenMatrix &data, bool keep_moments=false)
Standardizes the vector of responses (y values).
Definition: GaussianProcess.C:144

SurrogateTrainer::_sampler
Sampler & _sampler
Definition: SurrogateTrainer.h:119

StochasticTools::GaussianProcess::GPOptimizerOptions::batch_size
const unsigned int batch_size
The batch isize for Adam optimizer.
Definition: GaussianProcess.h:78

InputParameters::addRequiredParam
void addRequiredParam(const std::string &name, const std::string &doc_string)

GaussianProcessTrainer::_do_tuning
bool _do_tuning
Flag to toggle hyperparameter tuning/optimization.
Definition: GaussianProcessTrainer.h:61

SurrogateTrainer::_n_outputs
unsigned int & _n_outputs
The number of outputs.
Definition: SurrogateTrainer.h:135

GaussianProcessTrainer::postTrain
virtual void postTrain() override
Definition: GaussianProcessTrainer.C:122

GeneralUserObject::isParamValid
bool isParamValid(const std::string &name) const

GaussianProcessTrainer::GaussianProcessTrainer
GaussianProcessTrainer(const InputParameters &parameters)
Definition: GaussianProcessTrainer.C:51

InputParameters

StochasticTools
Enum for batch type in stochastic tools MultiApp.
Definition: StochasticToolsTypes.h:13

StochasticTools::GaussianProcess::dataStandardizer
StochasticTools::Standardizer & dataStandardizer()
Definition: GaussianProcess.h:204

StochasticTools::GaussianProcess::paramStandardizer
StochasticTools::Standardizer & paramStandardizer()
Get non-constant reference to the contained structures (if they need to be modified from the utside) ...
Definition: GaussianProcess.h:203

GaussianProcessTrainer::validParams
static InputParameters validParams()
Definition: GaussianProcessTrainer.C:25

registerMooseObject
registerMooseObject("StochasticToolsApp", GaussianProcessTrainer)

GeneralUserObject::getParam
const T & getParam(const std::string &name) const

Sampler.h

GaussianProcessTrainer::_predictor_row
const std::vector< Real > & _predictor_row
Data from the current predictor row.
Definition: GaussianProcessTrainer.h:37

GeneralUserObject::paramError
void paramError(const std::string &param, Args... args) const

RealEigenMatrix
Eigen::Matrix< Real, Eigen::Dynamic, Eigen::Dynamic > RealEigenMatrix

StochasticTools::GaussianProcess::initialize
void initialize(CovarianceFunctionBase *covariance_function, const std::vector< std::string > &params_to_tune, const std::vector< Real > &min=std::vector< Real >(), const std::vector< Real > &max=std::vector< Real >())
Initializes the most important structures in the Gaussian Process: the covariance function and a tuni...
Definition: GaussianProcess.C:49

Sampler::getNumberOfRows
dof_id_type getNumberOfRows() const

InputParameters::isParamSetByUser
bool isParamSetByUser(const std::string &name) const

GaussianProcessTrainer::preTrain
virtual void preTrain() override
Definition: GaussianProcessTrainer.C:98

SurrogateTrainer::getLocalSampleSize
unsigned int getLocalSampleSize() const
Definition: SurrogateTrainer.h:107

Real
DIE A HORRIBLE DEATH HERE typedef LIBMESH_DEFAULT_SCALAR_TYPE Real

SurrogateTrainer
This is the main trainer base class.
Definition: SurrogateTrainer.h:55

StochasticTools::Standardizer::set
void set(const Real &n)
Methods for setting mean and standard deviation directly Sets mean=0, std=1 for n variables...
Definition: Standardizer.C:16

make_range
IntRange< T > make_range(T beg, T end)

GeneralUserObject::mooseError
void mooseError(Args &&... args) const

GaussianProcessTrainer::_standardize_data
bool _standardize_data
Switch for training data(y) standardization.
Definition: GaussianProcessTrainer.h:58

GaussianProcessTrainer::_data_buffer
std::vector< std::vector< Real > > _data_buffer
Data (y) used for training.
Definition: GaussianProcessTrainer.h:46

GaussianProcessTrainer::_training_data
RealEigenMatrix _training_data
Data (y) used for training.
Definition: GaussianProcessTrainer.h:52

InputParameters::addClassDescription
void addClassDescription(const std::string &doc_string)

GeneralUserObject::parameters
const InputParameters & parameters() const

CovarianceFunctionBase::numOutputs
unsigned int numOutputs() const
Return the number of outputs assumed for this covariance function.
Definition: CovarianceFunctionBase.h:85

SurrogateTrainer::validParams
static InputParameters validParams()
Definition: SurrogateTrainer.C:34

GaussianProcessTrainer::_gp
StochasticTools::GaussianProcess & _gp
Gaussian process handler responsible for managing training related tasks.
Definition: GaussianProcessTrainer.h:40

GaussianProcessTrainer::_params_buffer
std::vector< std::vector< Real > > _params_buffer
Parameters (x) used for training – we&#39;ll allgather these in postTrain().
Definition: GaussianProcessTrainer.h:43

int
void ErrorVector unsigned int

StochasticTools::GaussianProcess::standardizeParameters
void standardizeParameters(RealEigenMatrix &parameters, bool keep_moments=false)
Standardizes the vector of input parameters (x values).
Definition: GaussianProcess.C:136

GaussianProcessTrainer::_standardize_params
bool _standardize_params
Switch for training param (x) standardization.
Definition: GaussianProcessTrainer.h:55

CovarianceInterface::getCovarianceFunctionByName
CovarianceFunctionBase * getCovarianceFunctionByName(const UserObjectName &name) const
Lookup a CovarianceFunction object by name and return pointer.
Definition: CovarianceInterface.C:25