bpp-core/html/LowMemoryRescaledHmmLikelihood_8cpp_source.html

 // SPDX-FileCopyrightText: The Bio++ Development Group
 //
 // SPDX-License-Identifier: CECILL-2.1

 #include "LowMemoryRescaledHmmLikelihood.h"

 // from the STL:
 #include <iostream>
 #include <algorithm>
 using namespace bpp;
 using namespace std;

 LowMemoryRescaledHmmLikelihood::LowMemoryRescaledHmmLikelihood(
     std::shared_ptr<HmmStateAlphabet> hiddenAlphabet,
     std::shared_ptr<HmmTransitionMatrix> transitionMatrix,
     std::shared_ptr<HmmEmissionProbabilities> emissionProbabilities,
     const std::string& prefix,
     size_t maxSize) :
   AbstractHmmLikelihood(),
   AbstractParametrizable(prefix),
   hiddenAlphabet_(hiddenAlphabet),
   transitionMatrix_(transitionMatrix),
   emissionProbabilities_(emissionProbabilities),
   likelihood1_(),
   likelihood2_(),
   logLik_(),
   maxSize_(maxSize),
   breakPoints_(),
   nbStates_(),
   nbSites_()
 {
   if (!hiddenAlphabet)
     throw Exception("LowMemoryRescaledHmmLikelihood: null pointer passed for HmmStateAlphabet.");
   if (!transitionMatrix)
     throw Exception("LowMemoryRescaledHmmLikelihood: null pointer passed for HmmTransitionMatrix.");
   if (!emissionProbabilities)
     throw Exception("LowMemoryRescaledHmmLikelihood: null pointer passed for HmmEmissionProbabilities.");
   if (!hiddenAlphabet_->worksWith(transitionMatrix->hmmStateAlphabet()))
     throw Exception("LowMemoryRescaledHmmLikelihood: HmmTransitionMatrix and HmmEmissionProbabilities should point toward the same HmmStateAlphabet object.");
   if (!hiddenAlphabet_->worksWith(emissionProbabilities->hmmStateAlphabet()))
     throw Exception("LowMemoryRescaledHmmLikelihood: HmmTransitionMatrix and HmmEmissionProbabilities should point toward the same HmmStateAlphabet object.");
   nbStates_ = hiddenAlphabet_->getNumberOfStates();
   nbSites_ = emissionProbabilities_->getNumberOfPositions();

   // Manage parameters:
   addParameters_(hiddenAlphabet_->getParameters());
   addParameters_(transitionMatrix_->getParameters());
   addParameters_(emissionProbabilities_->getParameters());

   // Init arrays:
   likelihood1_.resize(nbStates_);
   likelihood2_.resize(nbStates_);

   // Compute:
   computeForward_();
 }

 void LowMemoryRescaledHmmLikelihood::setNamespace(const std::string& nameSpace)
 {
   AbstractParametrizable::setNamespace(nameSpace);

   hiddenAlphabet_->setNamespace(nameSpace);
   transitionMatrix_->setNamespace(nameSpace);
   emissionProbabilities_->setNamespace(nameSpace);
 }

 void LowMemoryRescaledHmmLikelihood::fireParameterChanged(const ParameterList& pl)
 {
   bool alphabetChanged    = hiddenAlphabet_->matchParametersValues(pl);
   bool transitionsChanged = transitionMatrix_->matchParametersValues(pl);
   bool emissionChanged    = emissionProbabilities_->matchParametersValues(pl);
   // these lines are necessary because the transitions and emissions can depend on the alphabet.
   // we could use a StateChangeEvent, but this would result in computing some calculations twice in some cases
   // (when both the alphabet and other parameter changed).
   if (alphabetChanged && !transitionsChanged)
     transitionMatrix_->setParametersValues(transitionMatrix_->getParameters());
   if (alphabetChanged && !emissionChanged)
     emissionProbabilities_->setParametersValues(emissionProbabilities_->getParameters());

   computeForward_();
 }

 /***************************************************************************************************************************/

 void LowMemoryRescaledHmmLikelihood::computeForward_()
 {
   double x;
   vector<double> tmp(nbStates_);
   vector<double> lScales(min(maxSize_, nbSites_));
   vector<double> trans(nbStates_ * nbStates_);

   // Transition probabilities:
   for (size_t i = 0; i < nbStates_; i++)
   {
     size_t ii = i * nbStates_;
     for (size_t j = 0; j < nbStates_; j++)
     {
       trans[ii + j] = transitionMatrix_->Pij(j, i);
     }
   }

   // Initialisation:
   double scale = 0;
   const vector<double>* emissions = &(*emissionProbabilities_)(0);
   for (size_t j = 0; j < nbStates_; j++)
   {
     size_t jj = j * nbStates_;
     x = 0;
     for (size_t k = 0; k < nbStates_; k++)
     {
       x += trans[k + jj] * transitionMatrix_->getEquilibriumFrequencies()[k];
     }
     tmp[j] = (*emissions)[j] * x;
     scale += tmp[j];
   }
   for (size_t j = 0; j < nbStates_; j++)
   {
     likelihood1_[j] = tmp[j] / scale;
   }
   lScales[0] = log(scale);

   vector<double>* previousLikelihood = &likelihood2_, * currentLikelihood = &likelihood1_, * tmpLikelihood;

   // Recursion:
   size_t nextBrkPt = nbSites_; // next break point
   vector<size_t>::const_iterator bpIt = breakPoints_.begin();
   if (bpIt != breakPoints_.end())
     nextBrkPt = *bpIt;

   double a;
   logLik_ = 0;
   size_t offset = 0;
   greater<double> cmp;
   for (size_t i = 1; i < nbSites_; i++)
   {
     // Swap pointers:
     tmpLikelihood = previousLikelihood;
     previousLikelihood = currentLikelihood;
     currentLikelihood = tmpLikelihood;

     scale = 0;
     emissions = &(*emissionProbabilities_)(i);
     if (i < nextBrkPt)
     {
       for (size_t j = 0; j < nbStates_; j++)
       {
         size_t jj = j * nbStates_;
         x = 0;
         for (size_t k = 0; k < nbStates_; k++)
         {
           a = trans[jj + k] * (*previousLikelihood)[k];
           if (a < 0)
           {
             // *ApplicationTools::warning << "Negative value for likelihood at " << i << ", state " << j << ": " << _likelihood[i-1][k] << ", Pij = " << _hiddenModel->Pij(k, j) << endl;
             a = 0;
           }
           x += a;
         }
         tmp[j] = (*emissions)[j] * x;
         if (tmp[j] < 0)
         {
           // *ApplicationTools::warning << "Negative emission probability at " << i << ", state " << j << ": " << _emissions[i][j] << endl;
           tmp[j] = 0;
         }
         scale += tmp[j];
       }
     }
     else // Reset markov chain:
     {
       for (size_t j = 0; j < nbStates_; j++)
       {
         size_t jj = j * nbStates_;
         x = 0;
         for (size_t k = 0; k < nbStates_; k++)
         {
           a = trans[jj + k] * transitionMatrix_->getEquilibriumFrequencies()[k];
           if (a < 0)
           {
             // *ApplicationTools::warning << "Negative value for likelihood at " << i << ", state " << j << ": " << _likelihood[i-1][k] << ", Pij = " << _hiddenModel->Pij(k, j) << endl;
             a = 0;
           }
           x += a;
         }
         tmp[j] = (*emissions)[j] * x;
         if (tmp[j] < 0)
         {
           // *ApplicationTools::warning << "Negative emission probability at " << i << ", state " << j << ": " << _emissions[i][j] << endl;
           tmp[j] = 0;
         }
         scale += tmp[j];
       }
       bpIt++;
       if (bpIt != breakPoints_.end())
         nextBrkPt = *bpIt;
       else
         nextBrkPt = nbSites_;
     }

     for (size_t j = 0; j < nbStates_; j++)
     {
       if (scale > 0)
         (*currentLikelihood)[j] = tmp[j] / scale;
       else
         (*currentLikelihood)[j] = 0;
     }
     lScales[i - offset] = log(scale);

     if (i - offset == maxSize_ - 1)
     {
       // We make partial calculations and reset the arrays:
       double partialLogLik = 0;
       sort(lScales.begin(), lScales.end(), cmp);
       for (size_t j = 0; j < maxSize_; ++j)
       {
         partialLogLik += lScales[j];
       }
       logLik_ += partialLogLik;
       offset += maxSize_;
     }
   }
   sort(lScales.begin(), lScales.begin() + static_cast<ptrdiff_t>(nbSites_ - offset), cmp);
   double partialLogLik = 0;
   for (size_t i = 0; i < nbSites_ - offset; ++i)
   {
     partialLogLik += lScales[i];
   }
   logLik_ += partialLogLik;
 }

 /***************************************************************************************************************************/
bpp::LowMemoryRescaledHmmLikelihood::transitionMatrix_
std::shared_ptr< HmmTransitionMatrix > transitionMatrix_
Definition: LowMemoryRescaledHmmLikelihood.h:41

bpp::LowMemoryRescaledHmmLikelihood::emissionProbabilities_
std::shared_ptr< HmmEmissionProbabilities > emissionProbabilities_
Definition: LowMemoryRescaledHmmLikelihood.h:42

bpp::LowMemoryRescaledHmmLikelihood::setNamespace
void setNamespace(const std::string &nameSpace) override
Set the namespace for the parameter names.
Definition: LowMemoryRescaledHmmLikelihood.cpp:58

bpp
Definition: ApplicationTools.h:22

bpp::AbstractParametrizable
A partial implementation of the Parametrizable interface.
Definition: AbstractParametrizable.h:26

bpp::AbstractParametrizable::setNamespace
void setNamespace(const std::string &prefix) override
Set the namespace for the parameter names.
Definition: AbstractParametrizable.cpp:10

std
STL namespace.

bpp::ParameterList
The parameter list object.
Definition: ParameterList.h:27

bpp::LowMemoryRescaledHmmLikelihood::hiddenAlphabet_
std::shared_ptr< HmmStateAlphabet > hiddenAlphabet_
The alphabet describing the hidden states.
Definition: LowMemoryRescaledHmmLikelihood.h:40

bpp::LowMemoryRescaledHmmLikelihood::nbSites_
size_t nbSites_
Definition: LowMemoryRescaledHmmLikelihood.h:56

bpp::LowMemoryRescaledHmmLikelihood::maxSize_
size_t maxSize_
Definition: LowMemoryRescaledHmmLikelihood.h:52

bpp::LowMemoryRescaledHmmLikelihood::logLik_
double logLik_
Definition: LowMemoryRescaledHmmLikelihood.h:51

bpp::LowMemoryRescaledHmmLikelihood::fireParameterChanged
void fireParameterChanged(const ParameterList &pl) override
Notify the class when one or several parameters have changed.
Definition: LowMemoryRescaledHmmLikelihood.cpp:67

bpp::AbstractHmmLikelihood
partial impmementation of Hmm Likelihoods.
Definition: HmmLikelihood.h:109

bpp::LowMemoryRescaledHmmLikelihood::nbStates_
size_t nbStates_
Definition: LowMemoryRescaledHmmLikelihood.h:56

bpp::Exception
Exception base class. Overload exception constructor (to control the exceptions mechanism). Destructor is already virtual (from std::exception)
Definition: Exceptions.h:20

LowMemoryRescaledHmmLikelihood.h

bpp::LowMemoryRescaledHmmLikelihood::computeForward_
void computeForward_()
Definition: LowMemoryRescaledHmmLikelihood.cpp:85

bpp::LowMemoryRescaledHmmLikelihood::likelihood2_
std::vector< double > likelihood2_
Definition: LowMemoryRescaledHmmLikelihood.h:50

bpp::LowMemoryRescaledHmmLikelihood::likelihood1_
std::vector< double > likelihood1_
The likelihood array.
Definition: LowMemoryRescaledHmmLikelihood.h:49

bpp::LowMemoryRescaledHmmLikelihood::LowMemoryRescaledHmmLikelihood
LowMemoryRescaledHmmLikelihood(std::shared_ptr< HmmStateAlphabet > hiddenAlphabet, std::shared_ptr< HmmTransitionMatrix > transitionMatrix, std::shared_ptr< HmmEmissionProbabilities > emissionProbabilities, const std::string &prefix, size_t maxSize=1000000)
Build a new LowMemoryRescaledHmmLikelihood object.
Definition: LowMemoryRescaledHmmLikelihood.cpp:13

bpp::LowMemoryRescaledHmmLikelihood::breakPoints_
std::vector< size_t > breakPoints_
Definition: LowMemoryRescaledHmmLikelihood.h:54

bpp::AbstractParametrizable::addParameters_
virtual void addParameters_(const ParameterList &parameters)
Definition: AbstractParametrizable.h:117