Pb de regression logistique

From: Raphael Pelissier (Raphael.Pelissier@mpl.ird.fr)
Date: Fri Apr 14 2006 - 13:50:45 MEST

  • Next message: Raphael Pelissier: "Re: Pb de regression logistique (correction)"

    Une petite question qui n’a pa grand chose a voir avec ade4, mais pour laquelle
    je ne trouve pas de reponse satisfaisante. Si quelqu’un a une idée ...

    Je souhaite ajuster un modele logistique de mortalite a des donnees
    d’inventaire d’arbres sur differents types de sol et recenses a deux dates
    espacees de dt.

    Problemes : j’ai plusieurs parcelles qui n’ont pas la meme periode
    d’observation et celle-ci ne se superpose pas aux types de sol (et je ne suis
    pas specialiste en regression logistique !).

    Question : comment corriger l’effet des differents dt dans un modele
    logistique ?

    Un modele logistique classique de mortalite s’ecrit :

    Pm = exp(b0 + bX)/(1 + exp(b0 + bX))

    ou Pm est la proba de mortalite sur la periode dt et X une variable codant pour
    les types de sols. Sous l'hypothese de stationarite la mortalite annuelle est
    Pm/dt.

    La fonction glm de R avec l’option family = binomial, ajuste le modele
    lineaire :

    Ln[pm/(1-pm)] = b0 + bX

    Si pm est estime par Nm/N0 avec N0 le nbr d'indiv initial et Nm le nbr de morts
    apres dt, le modele devient :

    ln[N0/(N0-Nm)] = ln[N0/Ns] = b0 + bX

    ou Ns est le nbr de survivants après dt

    Une premiere idée : mettre l’intervalle de temps en covariable dans le modele.
    J’obtiens des interactions avec plusieurs types de sol qui rendent
    l'interpretation difficile.

    Une deuxieme idée : corriger a priori les observations en fonction de dt.
    L’idee est d’ajuster une variable du type ln[(N0/Ns)/dt]. Mais comme mes
    observations sont des 0 et des 1 et pas directement (N0/Ns) et les differents
    intervalles d’observations ne se superposent pas aux types de sol, j’ai essaye
    de passer le terme correctif en parameter du modele sous la forme d’une “offset
    variable” dans la fonction glm. Si j’ai bien compris ca donne un modele dont la
    constante varie avec dt, ce qui pourrait s’ecrire d’une maniere probablement
    assez peu orthodoxe comme :
    Ln(N0/Ns)(i) = b0 + bX + ln(dt(i)), i.e. (N0/Ns)(i)=ln(dt(i))*exp(b0 + bX)

    Evidemment ca solutionne mes problemes d’interactions avec les types de sol !

    Une fois ajuste, le modele predit pm(i), la probabilite de mortalite de chaque
    individu i sur la periode d’observation dt(i). La mortalite annuelle dans une
    classe de sol serait donc la moyenne des pm(i)/dt(i) de la classe consideree
    (quid des erreurs standarts ???).

    Est-ce une ineptie ????

    Raphael Pelissier
    UMR AMAP
    TA40/PS2
    34398 Montpellier cedex05

    -------------------------------------------------
    This mail sent through IMP: http://horde.org/imp/



    This archive was generated by hypermail 2b30 : Fri Apr 14 2006 - 13:53:41 MEST