bpp-phyl/html/PseudoNewtonOptimizer_8cpp_source.html

 // SPDX-FileCopyrightText: The Bio++ Development Group

 //

 // SPDX-License-Identifier: CECILL-2.1


 /**************************************************************************/


 #include "PseudoNewtonOptimizer.h"


 #include <Bpp/Numeric/VectorTools.h>

 #include <Bpp/Numeric/Function/ConjugateGradientMultiDimensions.h>

 #include <Bpp/Text/TextTools.h>

 #include <Bpp/App/ApplicationTools.h>


 #include "Likelihood/PhyloLikelihoods/PhyloLikelihood.h"

 #include <Bpp/Phyl/Likelihood/PhyloLikelihoods/SingleProcessPhyloLikelihood.h>

 #include <Bpp/Numeric/Function/ThreePointsNumericalDerivative.h>


 using namespace bpp;


 /**************************************************************************/


 double PseudoNewtonOptimizer::PNStopCondition::getCurrentTolerance() const

 {

   return NumTools::abs<double>(

         dynamic_cast<const PseudoNewtonOptimizer*>(optimizer_)->currentValue_ -

         dynamic_cast<const PseudoNewtonOptimizer*>(optimizer_)->previousValue_);

 }


 /**************************************************************************/


 bool PseudoNewtonOptimizer::PNStopCondition::isToleranceReached() const

 {

   return getCurrentTolerance() < tolerance_;

 }


 /**************************************************************************/


 PseudoNewtonOptimizer::PseudoNewtonOptimizer(shared_ptr<SecondOrderDerivable> function) :

   AbstractOptimizer(function),

   previousPoint_(),

   previousValue_(0),

   n_(0),

   params_(),

   maxCorrection_(10),

   useCG_(true)

 {

   setDefaultStopCondition_(make_shared<FunctionStopCondition>(this));

   setStopCondition(getDefaultStopCondition());

 }


 /**************************************************************************/


 void PseudoNewtonOptimizer::doInit(const ParameterList& params)

 {

   n_ = getParameters().size();

   params_ = getParameters().getParameterNames();

   secondOrderDerivableFunction().enableSecondOrderDerivatives(true);

   secondOrderDerivableFunction().setParameters(getParameters());

 }


 /**************************************************************************/


 double PseudoNewtonOptimizer::doStep()

 {

   ParameterList* bckPoint = 0;

   if (updateParameters())

     bckPoint = new ParameterList(getFunction()->getParameters());

   double newValue = 0;

   // Compute derivative at current point:

   std::vector<double> movements(n_);

   ParameterList newPoint = getParameters();


   for (size_t i = 0; i < n_; i++)

   {

     double firstOrderDerivative = secondOrderDerivableFunction().getFirstOrderDerivative(params_[i]);

     double secondOrderDerivative = secondOrderDerivableFunction().getSecondOrderDerivative(params_[i]);

     if (secondOrderDerivative == 0)

     {

       movements[i] = 0;

     }

     else if (secondOrderDerivative < 0)

     {

       printMessage("!!! Second order derivative is negative for parameter " + params_[i] + "(" + TextTools::toString(getParameters()[i].getValue()) + "). Moving in the other direction.");

       // movements[i] = 0;  // We want to reach a minimum, not a maximum!

       // My personal improvement:

       movements[i] = -firstOrderDerivative / secondOrderDerivative;

     }

     else

       movements[i] = firstOrderDerivative / secondOrderDerivative;

     if (std::isnan(movements[i]))

     {

       printMessage("!!! Non derivable point at " + params_[i] + ". No move performed. (f=" + TextTools::toString(currentValue_) + ", d1=" + TextTools::toString(firstOrderDerivative) + ", d2=" + TextTools::toString(secondOrderDerivative) + ").");

       movements[i] = 0; // Either first or second order derivative is infinity. This may happen when the function == inf at this point.

     }

     // DEBUG:

     // cerr << "PN[" << params_[i] << "]=" << getParameters().parameter(params_[i]).getValue() << "\t" << movements[i] << "\t " << firstOrderDerivative << "\t" << secondOrderDerivative << endl;

     newPoint[i].setValue(getParameters()[i].getValue() - movements[i]);

     // Correct the movement in case of constraint (this is used in case of Felsenstein-Churchill correction:

     movements[i] = getParameters()[i].getValue() - newPoint[i].getValue();

   }

   newValue = getFunction()->f(newPoint);


   // Check newValue:

   unsigned int count = 0;

   while ((count < maxCorrection_) && ((newValue > currentValue_ + getStopCondition()->getTolerance()) || std::isnan(newValue)))

   {

     // Restore previous point (all parameters in case of global constraint):

     if ((count == 0) && updateParameters())

       getFunction()->setParameters(*bckPoint);


     if (!(useCG_ && (count == 3)))

     {

       printMessage("!!! Function at new point is greater than at current point: " + TextTools::toString(newValue) + ">" + TextTools::toString(currentValue_) + ". Applying Felsenstein-Churchill correction: " + TextTools::toString(count));


       for (size_t i = 0; i < movements.size(); i++)

       {

         movements[i] = movements[i] / 2;

         newPoint[i].setValue(getParameters()[i].getValue() - movements[i]);

       }

       newValue = getFunction()->f(newPoint);

     }

     else

     {

       printMessage("!!! Felsenstein-Churchill correction applied too many times.");

       printMessage("Use conjugate gradients optimization.");

       secondOrderDerivableFunction().enableSecondOrderDerivatives(false);

       ConjugateGradientMultiDimensions opt(dynamic_pointer_cast<FirstOrderDerivable>(function_));

       opt.setConstraintPolicy(getConstraintPolicy());

       opt.setProfiler(getProfiler());

       opt.setMessageHandler(getMessageHandler());

       opt.setVerbose(0);

       double tol = std::max(getStopCondition()->getCurrentTolerance() / 2., getStopCondition()->getTolerance());

       opt.getStopCondition()->setTolerance(tol);

       opt.setMaximumNumberOfEvaluations(nbEvalMax_);

       getFunction()->setParameters(getParameters());

       opt.init(getParameters());

       opt.optimize();

       newPoint = opt.getParameters();

       newValue = opt.getFunctionValue();


       if (newValue > currentValue_ + tol)

       {

         printMessage("!!! Conjugate gradient method failed to improve likelihood.");

         printMessage("Back to Felsenstein-Churchill method.");

       }

     }

     count++;

   }


   if (newValue > currentValue_ + getStopCondition()->getTolerance())

   {

     printMessage("PseudoNewtonOptimizer::doStep. Value could not be ameliorated!");

     newValue = currentValue_;

   }

   else

   {

     secondOrderDerivableFunction().enableSecondOrderDerivatives(true);

     secondOrderDerivableFunction().setParameters(newPoint); // Compute derivatives for this point


     previousPoint_ = getParameters();

     previousValue_ = currentValue_;

     getParameters_() = newPoint;

   }


   if (updateParameters())

     delete bckPoint;

   return newValue;

 }


 /**************************************************************************/

ApplicationTools.h

ConjugateGradientMultiDimensions.h

PhyloLikelihood.h

PseudoNewtonOptimizer.h

SingleProcessPhyloLikelihood.h

TextTools.h

ThreePointsNumericalDerivative.h

VectorTools.h

bpp::AbstractOptimizationStopCondition::optimizer_
const OptimizerInterface * optimizer_

bpp::AbstractOptimizer

bpp::AbstractOptimizer::getStopCondition
std::shared_ptr< OptimizationStopCondition > getStopCondition() override

bpp::AbstractOptimizer::updateParameters
bool updateParameters() const override

bpp::ConjugateGradientMultiDimensions::setProfiler
void setProfiler(std::shared_ptr< OutputStream > profiler) override

bpp::AbstractOptimizer::function_
std::shared_ptr< FunctionInterface > function_

bpp::ConjugateGradientMultiDimensions::init
void init(const ParameterList &params) override

bpp::AbstractOptimizer::printMessage
void printMessage(const std::string &message)

bpp::AbstractOptimizer::getConstraintPolicy
std::string getConstraintPolicy() const override

bpp::ConjugateGradientMultiDimensions::setConstraintPolicy
void setConstraintPolicy(const std::string &constraintPolicy) override

bpp::AbstractOptimizer::getMessageHandler
std::shared_ptr< OutputStream > getMessageHandler() const override

bpp::AbstractOptimizer::function
const FunctionInterface & function() const override

bpp::AbstractOptimizer::getDefaultStopCondition
std::shared_ptr< OptimizationStopCondition > getDefaultStopCondition() override

bpp::ConjugateGradientMultiDimensions::setMessageHandler
void setMessageHandler(std::shared_ptr< OutputStream > mh) override

bpp::AbstractOptimizer::nbEvalMax_
unsigned int nbEvalMax_

bpp::ConjugateGradientMultiDimensions::getFunctionValue
double getFunctionValue() const override

bpp::AbstractOptimizer::setStopCondition
void setStopCondition(std::shared_ptr< OptimizationStopCondition > stopCondition) override

bpp::AbstractOptimizer::getProfiler
std::shared_ptr< OutputStream > getProfiler() const override

bpp::AbstractOptimizer::getParameters_
ParameterList & getParameters_()

bpp::AbstractOptimizer::setDefaultStopCondition_
void setDefaultStopCondition_(std::shared_ptr< OptimizationStopCondition > osc)

bpp::AbstractOptimizer::getFunction
std::shared_ptr< const FunctionInterface > getFunction() const override

bpp::AbstractOptimizer::getParameters
const ParameterList & getParameters() const override

bpp::ConjugateGradientMultiDimensions::optimize
double optimize() override

bpp::AbstractOptimizer::currentValue_
double currentValue_

bpp::ConjugateGradientMultiDimensions::setMaximumNumberOfEvaluations
void setMaximumNumberOfEvaluations(unsigned int max) override

bpp::ConjugateGradientMultiDimensions::setVerbose
void setVerbose(unsigned int v) override

bpp::ConjugateGradientMultiDimensions

bpp::SecondOrderDerivable::getFirstOrderDerivative
virtual double getFirstOrderDerivative(const std::string &variable) const=0

bpp::SecondOrderDerivable::setParameters
virtual void setParameters(const ParameterList &parameters)=0

bpp::ParameterList

bpp::ParameterList::size
size_t size() const

bpp::ParameterList::getParameterNames
virtual std::vector< std::string > getParameterNames() const

bpp::PseudoNewtonOptimizer::PNStopCondition::isToleranceReached
bool isToleranceReached() const
Definition: PseudoNewtonOptimizer.cpp:31

bpp::PseudoNewtonOptimizer::PNStopCondition::getCurrentTolerance
double getCurrentTolerance() const
Definition: PseudoNewtonOptimizer.cpp:22

bpp::PseudoNewtonOptimizer
This Optimizer implements Newton's algorithm for finding a minimum of a function. This is in fact a m...
Definition: PseudoNewtonOptimizer.h:25

bpp::PseudoNewtonOptimizer::useCG_
bool useCG_
Definition: PseudoNewtonOptimizer.h:55

bpp::PseudoNewtonOptimizer::doStep
double doStep()
Definition: PseudoNewtonOptimizer.cpp:63

bpp::PseudoNewtonOptimizer::n_
size_t n_
Definition: PseudoNewtonOptimizer.h:49

bpp::PseudoNewtonOptimizer::previousValue_
double previousValue_
Definition: PseudoNewtonOptimizer.h:47

bpp::PseudoNewtonOptimizer::previousPoint_
ParameterList previousPoint_
Definition: PseudoNewtonOptimizer.h:45

bpp::PseudoNewtonOptimizer::PseudoNewtonOptimizer
PseudoNewtonOptimizer(std::shared_ptr< SecondOrderDerivable > function)
Definition: PseudoNewtonOptimizer.cpp:38

bpp::PseudoNewtonOptimizer::params_
std::vector< std::string > params_
Definition: PseudoNewtonOptimizer.h:51

bpp::PseudoNewtonOptimizer::secondOrderDerivableFunction
const SecondOrderDerivable & secondOrderDerivableFunction() const
Definition: PseudoNewtonOptimizer.h:65

bpp::PseudoNewtonOptimizer::doInit
void doInit(const ParameterList &params)
Definition: PseudoNewtonOptimizer.cpp:53

bpp::PseudoNewtonOptimizer::maxCorrection_
unsigned int maxCorrection_
Definition: PseudoNewtonOptimizer.h:53

bpp::SecondOrderDerivable::enableSecondOrderDerivatives
virtual void enableSecondOrderDerivatives(bool yn)=0

bpp::SecondOrderDerivable::getSecondOrderDerivative
virtual double getSecondOrderDerivative(const std::string &variable) const=0

bpp::TextTools::toString
std::string toString(T t)

count
std::size_t count(const std::string &s, const std::string &pattern)

bpp
Defines the basic types of data flow nodes.