doxygen/modules/GenericActiveLearner_8h_source.html

 //* This file is part of the MOOSE framework
 //* https://www.mooseframework.org
 //*
 //* All rights reserved, see COPYRIGHT for full restrictions
 //* https://github.com/idaholab/moose/blob/master/COPYRIGHT
 //*
 //* Licensed under LGPL 2.1, please see LICENSE for details
 //* https://www.gnu.org/licenses/lgpl-2.1.html

 #pragma once

 #include "GeneralReporter.h"
 #include "GenericActiveLearningSampler.h"
 #include "ActiveLearningGaussianProcess.h"
 #include "GaussianProcess.h"
 #include "SurrogateModel.h"
 #include "SurrogateModelInterface.h"
 #include "GaussianProcessSurrogate.h"
 #include "ParallelAcquisitionFunctionBase.h"
 #include "ParallelAcquisitionInterface.h"

 // forward declarations
 template <typename SamplerType>
 class GenericActiveLearnerTempl;

 typedef GenericActiveLearnerTempl<GenericActiveLearningSampler> GenericActiveLearner;

 template <typename SamplerType>
 class GenericActiveLearnerTempl : public GeneralReporter,
                                   public ParallelAcquisitionInterface,
                                   public SurrogateModelInterface

 {
 public:
   static InputParameters validParams();
   GenericActiveLearnerTempl(const InputParameters & parameters);
   virtual void initialize() override {}
   virtual void finalize() override {}
   virtual void execute() override;

 protected:
   virtual void setupGPData(const std::vector<Real> & data_out, const DenseMatrix<Real> & data_in);

   virtual void computeGPOutput(std::vector<Real> & eval_outputs);

   virtual Real computeConvergenceValue();

   virtual void evaluateGPTest();

   virtual void setupGeneric();

   virtual void includeAdditionalInputs();

   virtual void getAcquisition(std::vector<Real> & acq_new, std::vector<unsigned int> & indices);

   SamplerType & _al_sampler;

   unsigned int _n_dim;

   dof_id_type _props;

   const std::vector<std::vector<Real>> & _inputs_test;

   const std::vector<Real> & _output_value;

   std::vector<Real> & _output_comm;

   std::vector<unsigned int> & _sorted_indices;

   const ActiveLearningGaussianProcess & _al_gp;

   const SurrogateModel & _gp_eval;

   ParallelAcquisitionFunctionBase & _acquisition_obj;

   std::vector<Real> & _acquisition_value;

   Real & _convergence_value;

   std::vector<std::vector<Real>> _inputs_test_modified;

   std::vector<std::vector<Real>> & _inputs_required;

   const bool & _penalize_acquisition;

   int _check_step;

   std::vector<std::vector<Real>> _gp_inputs;

   std::vector<Real> _gp_outputs;

   std::vector<Real> _gp_outputs_test;

   std::vector<Real> _gp_std_test;

   std::vector<Real> _length_scales;

   std::vector<Real> _generic;

   std::vector<Real> _eval_outputs_current;
 };

 template <typename SamplerType>
 InputParameters
 GenericActiveLearnerTempl<SamplerType>::validParams()
 {
   InputParameters params = GeneralReporter::validParams();
   params += ParallelAcquisitionInterface::validParams();
   params.addClassDescription("A generic reporter to support parallel active learning: re-trains GP "
                              "and picks the next best batch.");
   params.addRequiredParam<ReporterName>("output_value",
                                         "Value of the model output from the SubApp.");
   params.addParam<ReporterValueName>(
       "outputs_required",
       "outputs_required",
       "Modified value of the model output from this reporter class.");
   params.addRequiredParam<SamplerName>("sampler", "The sampler object.");
   params.addRequiredParam<UserObjectName>("al_gp", "Active learning GP trainer.");
   params.addRequiredParam<UserObjectName>("gp_evaluator", "Evaluator for the trained GP.");
   params.addParam<ReporterValueName>(
       "sorted_indices",
       "sorted_indices",
       "The sorted sample indices in order of importance to evaluate the subApp.");
   params.addParam<ReporterValueName>(
       "acquisition_function",
       "acquisition_function",
       "The values of the acquistion function in the current iteration.");
   params.addParam<ReporterValueName>(
       "convergence_value", "convergence_value", "Value to measure convergence of active learning.");
   params.addParam<ReporterValueName>(
       "inputs", "inputs", "Modified value of the model inputs from this reporter class.");
   params.addRequiredParam<UserObjectName>("acquisition", "Name of the acquisition function.");
   params.addParam<bool>(
       "penalize_acquisition",
       true,
       "Set true to prevent clustering of the best batch inputs when operating in parallel.");
   return params;
 }

 template <typename SamplerType>
 GenericActiveLearnerTempl<SamplerType>::GenericActiveLearnerTempl(
     const InputParameters & parameters)
   : GeneralReporter(parameters),
     ParallelAcquisitionInterface(parameters),
     SurrogateModelInterface(this),
     _al_sampler(getSampler<SamplerType>("sampler")),
     _n_dim(_al_sampler.getNumberOfCols()),
     _props(_al_sampler.getNumParallelProposals()),
     _inputs_test(_al_sampler.getSampleTries()),
     _output_value(getReporterValue<std::vector<Real>>("output_value", REPORTER_MODE_DISTRIBUTED)),
     _output_comm(declareValue<std::vector<Real>>("outputs_required")),
     _sorted_indices(declareValue<std::vector<unsigned int>>("sorted_indices")),
     _al_gp(getUserObject<ActiveLearningGaussianProcess>("al_gp")),
     _gp_eval(getSurrogateModel<GaussianProcessSurrogate>("gp_evaluator")),
     _acquisition_obj(getParallelAcquisitionFunctionByName(getParam<UserObjectName>("acquisition"))),
     _acquisition_value(declareValue<std::vector<Real>>("acquisition_function")),
     _convergence_value(declareValue<Real>("convergence_value")),
     _inputs_required(declareValue<std::vector<std::vector<Real>>>("inputs")),
     _penalize_acquisition(getParam<bool>("penalize_acquisition")),
     _check_step(std::numeric_limits<int>::max())
 {
   // Setting up the variable sizes to facilitate active learning.
   _gp_outputs_test.resize(_inputs_test.size());
   _gp_std_test.resize(_inputs_test.size());
   _acquisition_value.resize(_props);
   _length_scales.resize(_n_dim);
   _eval_outputs_current.resize(_props);
   _generic.resize(1);
   _inputs_required.resize(_props, std::vector<Real>(_n_dim, 0.0));
   _sorted_indices.resize(_props, 1u);
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::setupGPData(const std::vector<Real> & data_out,
                                                     const DenseMatrix<Real> & data_in)
 {
   for (unsigned int i = 0; i < data_out.size(); ++i)
   {
     for (unsigned int j = 0; j < _n_dim; ++j)
       _inputs_required[i][j] = data_in(i, j);
     _gp_inputs.push_back(_inputs_required[i]);
     _gp_outputs.push_back(data_out[i]);
   }
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::computeGPOutput(std::vector<Real> & eval_outputs)
 {
   for (unsigned int i = 0; i < eval_outputs.size(); ++i)
     eval_outputs[i] = _gp_eval.evaluate(_gp_inputs[i]);
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::setupGeneric()
 {
   _generic = _gp_outputs;
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::includeAdditionalInputs()
 {
   _inputs_test_modified = _inputs_test;
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::getAcquisition(std::vector<Real> & acq_new,
                                                        std::vector<unsigned int> & indices)
 {
   std::vector<Real> acq;
   acq.resize(_inputs_test.size());
   includeAdditionalInputs();
   _acquisition_obj.computeAcquisition(
       acq, _gp_outputs_test, _gp_std_test, _inputs_test_modified, _gp_inputs, _generic);
   acq_new = acq;
   if (_penalize_acquisition)
     _acquisition_obj.penalizeAcquisition(
         acq_new, indices, acq, _length_scales, _inputs_test_modified);
 }

 template <typename SamplerType>
 Real
 GenericActiveLearnerTempl<SamplerType>::computeConvergenceValue()
 {
   Real convergence_value = 0.0;
   for (unsigned int ii = 0; ii < _output_comm.size(); ++ii)
     convergence_value += Utility::pow<2>(_output_comm[ii] - _eval_outputs_current[ii]);
   convergence_value = std::sqrt(convergence_value) / _output_comm.size();
   return convergence_value;
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::evaluateGPTest()
 {
   for (unsigned int i = 0; i < _gp_outputs_test.size(); ++i)
     _gp_outputs_test[i] = _gp_eval.evaluate(_inputs_test[i], _gp_std_test[i]);
 }

 template <typename SamplerType>
 void
 GenericActiveLearnerTempl<SamplerType>::execute()
 {
   if (_al_sampler.getNumberOfLocalRows() == 0 || _check_step == _t_step)
   {
     _check_step = _t_step;
     return;
   }

   DenseMatrix<Real> data_in(_al_sampler.getNumberOfRows(), _al_sampler.getNumberOfCols());
   for (dof_id_type ss = _al_sampler.getLocalRowBegin(); ss < _al_sampler.getLocalRowEnd(); ++ss)
   {
     const auto data = _al_sampler.getNextLocalRow();
     for (unsigned int j = 0; j < _al_sampler.getNumberOfCols(); ++j)
       data_in(ss, j) = data[j];
   }
   _communicator.sum(data_in.get_values());
   _output_comm = _output_value;
   _communicator.allgather(_output_comm);

   if (_t_step > 1)
   {
     // Setup the GP training data
     setupGPData(_output_comm, data_in);

     // Compute the convergence value before re-training the GP
     if (_t_step > 2)
     {
       computeGPOutput(_eval_outputs_current);
       _convergence_value = computeConvergenceValue();
     }

     // Retrain the GP and get the length scales
     _al_gp.reTrain(_gp_inputs, _gp_outputs);
     _length_scales = _al_gp.getLengthScales();

     // Evaluate the GP on all the test samples sent by the Sampler
     evaluateGPTest();

     // Setup the generic variable for acquisition computation (depends on the objective:
     // optimization, UQ, etc.)
     setupGeneric();

     // Get the acquisition function values and ordering of indices as per the acquisition
     std::vector<Real> acq_new;
     std::vector<unsigned int> indices;
     indices.resize(_inputs_test.size());
     getAcquisition(acq_new, indices);

     // Output the acquisition function values and the best ordering of the indices
     std::copy_n(indices.begin(), _props, _sorted_indices.begin());
     std::copy_n(acq_new.begin(), _props, _acquisition_value.begin());
   }
   else
     std::iota(_sorted_indices.begin(), _sorted_indices.end(), 0);

   // Track the current step
   _check_step = _t_step;
 }
GenericActiveLearnerTempl
A generic reporter to support parallel active learning: re-trains GP and picks the next best batch...
Definition: GenericActiveLearner.h:24

GenericActiveLearnerTempl::_inputs_test_modified
std::vector< std::vector< Real > > _inputs_test_modified
Storage for all the modified proposed samples to test the GP model.
Definition: GenericActiveLearner.h:126

GenericActiveLearnerTempl::_gp_inputs
std::vector< std::vector< Real > > _gp_inputs
Storage for the GP re-training inputs.
Definition: GenericActiveLearner.h:138

GenericActiveLearnerTempl::_output_value
const std::vector< Real > & _output_value
Model output value from SubApp.
Definition: GenericActiveLearner.h:102

ParallelAcquisitionFunctionBase.h

ActiveLearningGaussianProcess
Definition: ActiveLearningGaussianProcess.h:30

InputParameters::addParam
void addParam(const std::string &name, const std::initializer_list< typename T::value_type > &value, const std::string &doc_string)

GenericActiveLearner
GenericActiveLearnerTempl< GenericActiveLearningSampler > GenericActiveLearner
Definition: GenericActiveLearner.h:24

GeneralReporter

GenericActiveLearnerTempl::computeGPOutput
virtual void computeGPOutput(std::vector< Real > &eval_outputs)
Computes the outputs of the trained GP model.
Definition: GenericActiveLearner.h:245

GeneralReporter.h

GenericActiveLearnerTempl::_eval_outputs_current
std::vector< Real > _eval_outputs_current
The GP outputs from the current iteration before re-training (to evaluate convergence) ...
Definition: GenericActiveLearner.h:156

GaussianProcessSurrogate
Definition: GaussianProcessSurrogate.h:18

GeneralReporter::parameters
const InputParameters & parameters() const

GenericActiveLearnerTempl::_acquisition_value
std::vector< Real > & _acquisition_value
The acquistion function values in the current iteration.
Definition: GenericActiveLearner.h:120

GaussianProcessSurrogate.h

GenericActiveLearnerTempl::_gp_eval
const SurrogateModel & _gp_eval
The GP evaluator object that permits re-evaluations.
Definition: GenericActiveLearner.h:114

ParallelAcquisitionInterface::validParams
static InputParameters validParams()
Definition: ParallelAcquisitionInterface.C:13

SurrogateModel
Definition: SurrogateModel.h:18

std

GenericActiveLearningSampler.h

GenericActiveLearnerTempl::initialize
virtual void initialize() override
Definition: GenericActiveLearner.h:41

GenericActiveLearnerTempl::_length_scales
std::vector< Real > _length_scales
Storage for the length scales after the GP training.
Definition: GenericActiveLearner.h:150

GeneralReporter::validParams
static InputParameters validParams()

GenericActiveLearnerTempl::_props
dof_id_type _props
Storage for the number of parallel proposals.
Definition: GenericActiveLearner.h:96

ParallelAcquisitionFunctionBase
All ParallelAcquisition functions should inherit from this class.
Definition: ParallelAcquisitionFunctionBase.h:19

InputParameters::addRequiredParam
void addRequiredParam(const std::string &name, const std::string &doc_string)

GenericActiveLearnerTempl::_n_dim
unsigned int _n_dim
The input dimension for GP, equal to Sampler columns.
Definition: GenericActiveLearner.h:93

max
auto max(const L &left, const R &right)

GenericActiveLearnerTempl::_sorted_indices
std::vector< unsigned int > & _sorted_indices
The selected sample indices to evaluate the subApp.
Definition: GenericActiveLearner.h:108

InputParameters

GenericActiveLearnerTempl::execute
virtual void execute() override
Definition: GenericActiveLearner.h:302

ParallelAcquisitionInterface
Definition: ParallelAcquisitionInterface.h:16

GenericActiveLearnerTempl::finalize
virtual void finalize() override
Definition: GenericActiveLearner.h:42

GenericActiveLearnerTempl::_inputs_test
const std::vector< std::vector< Real > > & _inputs_test
Storage for all the proposed samples to test the GP model.
Definition: GenericActiveLearner.h:99

GenericActiveLearnerTempl::evaluateGPTest
virtual void evaluateGPTest()
Evaluate the GP on all the test samples sent by the Sampler.
Definition: GenericActiveLearner.h:294

GenericActiveLearnerTempl::_penalize_acquisition
const bool & _penalize_acquisition
Penalize acquisition to prevent clustering when operating in parallel.
Definition: GenericActiveLearner.h:132

GenericActiveLearnerTempl::validParams
static InputParameters validParams()
Definition: GenericActiveLearner.h:161

GenericActiveLearnerTempl::_convergence_value
Real & _convergence_value
For monitoring convergence of active learning.
Definition: GenericActiveLearner.h:123

GenericActiveLearnerTempl::_output_comm
std::vector< Real > & _output_comm
Modified value of model output by this reporter class.
Definition: GenericActiveLearner.h:105

GenericActiveLearnerTempl::includeAdditionalInputs
virtual void includeAdditionalInputs()
Include additional inputs before evaluating the acquisition function.
Definition: GenericActiveLearner.h:260

SurrogateModelInterface.h

REPORTER_MODE_DISTRIBUTED
const ReporterMode REPORTER_MODE_DISTRIBUTED

GenericActiveLearnerTempl::_acquisition_obj
ParallelAcquisitionFunctionBase & _acquisition_obj
Storage for the parallel acquisition object to be utilized.
Definition: GenericActiveLearner.h:117

GenericActiveLearnerTempl::setupGeneric
virtual void setupGeneric()
Setup the generic variable for acquisition computation (depends on the objective: optimization...
Definition: GenericActiveLearner.h:253

GenericActiveLearnerTempl::GenericActiveLearnerTempl
GenericActiveLearnerTempl(const InputParameters &parameters)
Definition: GenericActiveLearner.h:197

SurrogateModel.h

GenericActiveLearnerTempl::computeConvergenceValue
virtual Real computeConvergenceValue()
Computes the convergence value during active learning.
Definition: GenericActiveLearner.h:283

GenericActiveLearnerTempl::setupGPData
virtual void setupGPData(const std::vector< Real > &data_out, const DenseMatrix< Real > &data_in)
Sets up the training data for the GP model.
Definition: GenericActiveLearner.h:231

GenericActiveLearnerTempl::getAcquisition
virtual void getAcquisition(std::vector< Real > &acq_new, std::vector< unsigned int > &indices)
Output the acquisition function values and ordering of the indices.
Definition: GenericActiveLearner.h:267

Real
DIE A HORRIBLE DEATH HERE typedef LIBMESH_DEFAULT_SCALAR_TYPE Real

SurrogateModelInterface
Interface for objects that need to use samplers.
Definition: SurrogateModelInterface.h:31

GenericActiveLearnerTempl::_al_gp
const ActiveLearningGaussianProcess & _al_gp
The active learning GP trainer that permits re-training.
Definition: GenericActiveLearner.h:111

InputParameters::addClassDescription
void addClassDescription(const std::string &doc_string)

ParallelAcquisitionInterface.h

GenericActiveLearnerTempl::_gp_outputs
std::vector< Real > _gp_outputs
Storage for the GP re-training outputs.
Definition: GenericActiveLearner.h:141

EM::j
static const std::complex< double > j(0, 1)
Complex number "j" (also known as "i")

GaussianProcess.h

GenericActiveLearnerTempl::_gp_std_test
std::vector< Real > _gp_std_test
Outputs of GP model standard deviation for the test samples.
Definition: GenericActiveLearner.h:147

GenericActiveLearnerTempl::_al_sampler
SamplerType & _al_sampler
The base sampler.
Definition: GenericActiveLearner.h:90

GenericActiveLearnerTempl::_inputs_required
std::vector< std::vector< Real > > & _inputs_required
Transmit the required inputs to the json file.
Definition: GenericActiveLearner.h:129

GenericActiveLearnerTempl::_generic
std::vector< Real > _generic
A generic parameter to be passed to the acquisition function.
Definition: GenericActiveLearner.h:153

ActiveLearningGaussianProcess.h

GenericActiveLearnerTempl::_check_step
int _check_step
Ensure that the MCMC algorithm proceeds in a sequential fashion.
Definition: GenericActiveLearner.h:135

DenseMatrix< Real >

int
void ErrorVector unsigned int

ReporterName

GenericActiveLearnerTempl::_gp_outputs_test
std::vector< Real > _gp_outputs_test
Outputs of GP model for the test samples.
Definition: GenericActiveLearner.h:144

dof_id_type
uint8_t dof_id_type