dmpbbo/html/DmpContextualTwoStep_8cpp_source.html

 #include "dmp/Dmp.hpp"
 #include "dmp/DmpContextualTwoStep.hpp"

 #include "dmp/Trajectory.hpp"
 #include "functionapproximators/FunctionApproximator.hpp"
 #include "functionapproximators/FunctionApproximatorLWR.hpp"

 #include <boost/serialization/vector.hpp>

 #include <iostream>
 #include <eigen3/Eigen/Core>

 using namespace std;
 using namespace Eigen;

 namespace DmpBbo {

 DmpContextualTwoStep::DmpContextualTwoStep(int n_dims_dmp, std::vector<FunctionApproximator*> function_approximators, FunctionApproximator* policy_parameter_function, DmpType dmp_type)
 :  DmpContextual(n_dims_dmp, function_approximators, dmp_type)
 {
   policy_parameter_function_ = vector<vector<FunctionApproximator*> >(dim_orig());
   for (int dd=0; dd<dim_orig(); dd++)
   {
     policy_parameter_function_[dd] = vector<FunctionApproximator*>(1);
     policy_parameter_function_[dd][0] = policy_parameter_function->clone();
   }
 }

 // Overloads in DMP computeFunctionApproximatorOutput
 void DmpContextualTwoStep::computeFunctionApproximatorOutput(
     const Eigen::Ref<const Eigen::MatrixXd>& phase_state, Eigen::MatrixXd& fa_output) const
 {
   int n_time_steps = phase_state.rows();
   fa_output.resize(n_time_steps,dim_orig());
   fa_output.fill(0.0);

   if (task_parameters_.rows()==0)
   {
     // When the task parameters are not set, we cannot compute the output of the function approximator.
     return;
   }

   MatrixXd task_parameters = task_parameters_;
   if (task_parameters.rows()==1)
   {
     task_parameters = task_parameters.row(0).replicate(n_time_steps,1).eval();
   }
   else if (task_parameters.cols()==1)
   {
     task_parameters = task_parameters.col(0).transpose().replicate(n_time_steps,1).eval();
   }

   assert(n_time_steps==task_parameters.rows());

   //int n_task_parameters = task_parameters.cols();

   VectorXd model_parameters;
   MatrixXd output(1,1);
   for (int dd=0; dd<dim_orig(); dd++)
   {
     int n_parameters = function_approximator(dd)->getParameterVectorSelectedSize();
     model_parameters.resize(n_parameters);
     for (int pp=0; pp<n_parameters; pp++)
     {
       policy_parameter_function_[dd][pp]->predict(task_parameters,output);
       model_parameters[pp] = output(0,0);
     }
     function_approximator(dd)->setParameterVectorSelected(model_parameters);
   }

   // The parameters of the function_approximators have been set, get their outputs now.
   for (int dd=0; dd<dim_orig(); dd++)
   {
     function_approximator(dd)->predict(phase_state,output);
     if (output.size()>0)
     {
       fa_output.col(dd) = output;
     }
   }

 }

 bool DmpContextualTwoStep::isTrained(void) const
 {
   for (int dd=0; dd<dim_orig(); dd++)
     for (unsigned int pp=0; pp<policy_parameter_function_[dd].size(); pp++)
       if (!policy_parameter_function_[dd][pp]->isTrained())
         return false;

   return true;
 }

 void  DmpContextualTwoStep::train(const vector<Trajectory>& trajectories, const vector<MatrixXd>& task_parameters, string save_directory, bool overwrite)
 {
   // Here's the basic structure of this function
   // 1) Do some checks
   // 2) Train a separate Dmp for each demonstration, and get the resulting model parameters
   // 3) Gather all task parameter values for all demonstrations
   // 4) Train the policy parameter function for each dimension and each model parameter


   //-----------------------------------------------------
   // 1) Do some checks

   // Check if inputs are of the right size.
   unsigned int n_demonstrations = trajectories.size();
   assert(n_demonstrations==task_parameters.size());


   // Then check if the trajectories have the same duration and initial/final state
   // Later on, if they are not the same, they should be learned also.
   checkTrainTrajectories(trajectories);

   // Set tau, initial_state and attractor_state from the trajectories
   set_tau(trajectories[0].duration());
   set_initial_state(trajectories[0].initial_y());
   set_attractor_state(trajectories[0].final_y());

   //-----------------------------------------------------
   // 2) Train a separate Dmp for each demonstration, and get the resulting model parameters
   std::set<std::string> selected;
   selected.insert("offsets");
   selected.insert("slopes");

   MatrixXd cur_task_parameters;
   VectorXd cur_model_parameters;// todo Remove redundant tmp variable
   vector<MatrixXd> all_model_parameters(n_demonstrations);
   for (unsigned int i_demo=0; i_demo<n_demonstrations; i_demo++)
   {

     string save_directory_demo;
     if (!save_directory.empty())
       save_directory_demo = save_directory + "/demo" + to_string(i_demo);

     Dmp::train(trajectories[i_demo],save_directory_demo,overwrite);

     for (int i_dim=0; i_dim<dim_orig(); i_dim++)
     {

       // todo Should be argument of constructor
       function_approximator(i_dim)->setSelectedParameters(selected);

       function_approximator(i_dim)->getParameterVectorSelected(cur_model_parameters);
       //cout << cur_model_parameters << endl;
       if (i_demo==0)
         all_model_parameters[i_dim].resize(n_demonstrations,cur_model_parameters.size());
       else
         assert(cur_model_parameters.size()==all_model_parameters[i_dim].cols());

       all_model_parameters[i_dim].row(i_demo) = cur_model_parameters;

     }
   }


   //-----------------------------------------------------
   // 3) Gather all task parameter values for all demonstrations

   // Gather task parameters in a matrix
   int n_task_parameters = task_parameters[0].cols();
   // This is the first time task_parameters_ is set, because this is the first time we know
   // n_task_parameters.
   // We set it so that set_task_parameters can check if task_parameters_.cols()==n_task_parameters
   task_parameters_ = MatrixXd::Zero(1,n_task_parameters);
   VectorXd cur_task_parameters_t0;

   MatrixXd inputs(n_demonstrations,n_task_parameters);
   for (unsigned int i_demo=0; i_demo<n_demonstrations; i_demo++)
   {
     // These are the task parameters for the current demonstration at t=0
     cur_task_parameters_t0 = task_parameters[i_demo].row(0);

     // Task parameter may not change over time for 2-Step contextual DMP
     // Start comparison to i_time=0 at i_time=1
     for (int i_time=1; i_time<task_parameters[i_demo].rows(); i_time++)
     {
       if ( (cur_task_parameters_t0.array() != task_parameters[i_demo].row(i_time).array()).any())
       {
         cerr << __FILE__ << ":" << __LINE__ << ":";
         cerr << "WARNING. For DmpContextualTwoStep, task parameters may not vary over time during training. Using task parameters at t=0 only." << endl;
       }
     }

     // Take the first row, i.e. at time_i = 0. We checked above if they are constant over time.
     inputs.row(i_demo) = cur_task_parameters_t0;
   }

   //-----------------------------------------------------
   // 4) Train the policy parameter function for each dimension and each model parameter

   // Input to policy parameter functions: task_parameters
   // Target for each policy parameter function: all_model_parameters.col(param)

   for (int i_dim=0; i_dim<dim_orig(); i_dim++)
   {
     int n_pol_pars = all_model_parameters[i_dim].cols();
     for (int i_pol_par=1; i_pol_par<n_pol_pars; i_pol_par++)
     {
       policy_parameter_function_[i_dim].push_back(policy_parameter_function_[i_dim][0]->clone());
       //cout << *(policy_parameter_function_[i_dim][i_pol_par]) << endl;
     }

     for (int i_pol_par=0; i_pol_par<n_pol_pars; i_pol_par++)
     {
       MatrixXd targets = all_model_parameters[i_dim].col(i_pol_par);
       //cout << "_________________" << endl;
       //cout << inputs.transpose() << endl << endl;
       //cout << targets.transpose() << endl;

       string save_directory_cur;
       if (!save_directory.empty())
           save_directory_cur = save_directory + "/dim" + to_string(i_dim) + "_polpar" + to_string(i_pol_par);

       policy_parameter_function_[i_dim][i_pol_par]->train(inputs,targets,save_directory_cur,overwrite);

     }
   }


 }

 template<class Archive>
 void DmpContextualTwoStep::serialize(Archive & ar, const unsigned int version)
 {
   // serialize base class information
   ar & BOOST_SERIALIZATION_BASE_OBJECT_NVP(DmpContextual);

   ar & BOOST_SERIALIZATION_NVP(policy_parameter_function_);

 }

 }
DmpBbo::Dmp::set_attractor_state
virtual void set_attractor_state(const Eigen::VectorXd &y_attr)
Accessor function for the attractor state of the system.
Definition: Dmp.cpp:873

Trajectory.hpp
Trajectory class header file.

DmpBbo::DynamicalSystem::dim_orig
int dim_orig(void) const
Get the dimensionality of the dynamical system, i.e.
Definition: DynamicalSystem.hpp:221

FunctionApproximator.hpp
FunctionApproximator class header file.

DmpBbo::Dmp::set_tau
virtual void set_tau(double tau)
Accessor function for the time constant.
Definition: Dmp.cpp:853

DmpBbo
Definition: CostFunction.hpp:30

DmpBbo::DmpContextualTwoStep::isTrained
bool isTrained(void) const
Return whether the DMP is trained or not.
Definition: DmpContextualTwoStep.cpp:106

DmpBbo::FunctionApproximator::setParameterVectorSelected
void setParameterVectorSelected(const Eigen::VectorXd &values, bool normalized=false)
Set all the values of the selected parameters with one vector.
Definition: FunctionApproximator.cpp:188

Eigen
Definition: EigenBoostSerialization.hpp:34

std

Dmp.hpp
Dmp class header file.

DmpBbo::DmpContextualTwoStep::computeFunctionApproximatorOutput
void computeFunctionApproximatorOutput(const Eigen::Ref< const Eigen::MatrixXd > &phase_state, Eigen::MatrixXd &fa_output) const
Compute the outputs of the function approximators.
Definition: DmpContextualTwoStep.cpp:53

DmpBbo::FunctionApproximator::getParameterVectorSelected
void getParameterVectorSelected(Eigen::VectorXd &values, bool normalized=false) const
Get the values of the selected parameters in one vector.
Definition: FunctionApproximator.cpp:171

DmpBbo::FunctionApproximator
Base class for all function approximators.
Definition: FunctionApproximator.hpp:48

DmpBbo::DmpContextual
Implementation of Contextual Dynamical Movement Primitives.
Definition: DmpContextual.hpp:79

DmpBbo::FunctionApproximator::predict
virtual void predict(const Eigen::Ref< const Eigen::MatrixXd > &inputs, Eigen::MatrixXd &outputs)=0
Query the function approximator to make a prediction.

DmpBbo::Dmp::DmpType
DmpType
Different types of DMPs that can be initialized.
Definition: Dmp.hpp:61

DmpBbo::DmpContextualTwoStep::train
void train(const std::vector< Trajectory > &trajectories, const std::vector< Eigen::MatrixXd > &task_parameters, std::string save_directory="", bool overwrite=true)
Train a contextual Dmp with a set of trajectories (and save results to file) This function is useful ...
Definition: DmpContextualTwoStep.cpp:116

DmpBbo::Dmp::train
virtual void train(const Trajectory &trajectory)
Train a DMP with a trajectory.
Definition: Dmp.cpp:643

DmpContextualTwoStep.hpp
Contextual Dmp class header file.

DmpBbo::Dmp::clone
Dmp * clone(void) const
Return a deep copy of this object.
Definition: Dmp.cpp:252

DmpBbo::Dmp::function_approximator
FunctionApproximator * function_approximator(int i_dim) const
Get a pointer to the function approximator for a certain dimension.
Definition: Dmp.hpp:345

DmpBbo::FunctionApproximator::clone
virtual FunctionApproximator * clone(void) const =0
Return a pointer to a deep copy of the FunctionApproximator object.

DmpBbo::DmpContextual::task_parameters_
Eigen::MatrixXd task_parameters_
The current task parameters.
Definition: DmpContextual.hpp:173

DmpBbo::FunctionApproximator::setSelectedParameters
void setSelectedParameters(const std::set< std::string > &selected_values_labels)
Determine which subset of parameters is represented in the vector returned by Parameterizable::getPar...
Definition: FunctionApproximator.cpp:194

DmpBbo::Dmp::set_initial_state
virtual void set_initial_state(const Eigen::VectorXd &y_init)
Accessor function for the initial state of the system.
Definition: Dmp.cpp:864

DmpBbo::FunctionApproximator::getParameterVectorSelectedSize
int getParameterVectorSelectedSize(void) const
Get the size of the vector of selected parameters, as returned by getParameterVectorSelected(.
Definition: FunctionApproximator.cpp:180

DmpBbo::DmpContextual::checkTrainTrajectories
void checkTrainTrajectories(const std::vector< Trajectory > &trajectories)
Check if several trajectories have the same duration and initial/final states.
Definition: DmpContextual.cpp:197

FunctionApproximatorLWR.hpp
FunctionApproximatorLWR class header file.