presence/absence, binomial, krigeage et géostatistiques

From: Patrick Giraudoux (patrick.giraudoux@univ-fcomte.fr)
Date: Sun Dec 21 2003 - 01:04:18 MET


Bonjour,

Je suis en train de ramer pour résoudre un problème dont je n'arrive pas à
croire qu'il ne soit pas trivial, vu qu'il doit se poser à quiconque fait de
l'épidémiologie, et que les épidémiologistes sont légions. Il est (en
principe) très simple. Je dispose de données spatialisées sous forme de
présence/absence (ex. points représentants des renards -ou des crottes- qui
sont ou non
porteur de l'échinocoque multiloculaire, Em) ou de données spatialisées de
villages où n1 personnes sont atteintes par Em et n2 ne le sont pas. Je
souhaiterais, à partir de tels jeux empiriques de données, "prédire" dans
l'espace étudié des probabilités (= prevalences) sur une grille de
coordonnées: une procédure, par exemple, analogue à celle pratiquée pour un
Krigeage. Ca serait encore mieux si cette prédiction pouvait optionnellement
être guidée par des co-variables (d'environnement) dont ont sait par
ailleurs qu'elles sont corrélées aux prévalences.

GeoRGlm empoigne ce type de problème par les techniques dites MCMC, manque
de pot mon background en maths et ma patience qui se facine difficilement
pour l'outil, ne me permettent pas de nager comme un poisson dans cette
approche. Plutôt d'y couler comme un fer à repasser. Je recherche donc des
exemples commentés "à appliquer" qui me permettraient par le geste
(bienfaits de l'apprentissage artisanal) d'avoir une compréhension
suffisamment pratique et critique de ces développement théoriques (dans
l'esprit de ce que nos bienfaiteurs de Lyon prodiguent à travers ADE pour
d'autres méthodes).

Quelqu'un pourrait-il m'aider en me donnant une ou plusieurs pistes:

- soit sur des méthodes alternatives plus abordables. GLM avec fonction de
lien binomiale ou poisson avec coordonnées géographiques en covariables
s'abstenir, me semble-t-il. Ca me parait un peu trop rustique pour être
honnête sauf à avoir des gradients unidirectionnels (ou presque) à
analyser -et on aurait, toujours me semble-t-il un serpent qui se mort la
queue. Mais je me plante peut-être dans cette appréciation.

- soit sur des publis ou documents qui ne sont pas sur le site de GeoRglm
qui me permettraient de dépasser le problème constitué par le manque de
"documentation pour les nuls" de GeoRglm.

- soit me dire simplement si c'est trivial ou non, si oui ce qui m'a
échappé, sinon d'attendre quelques années (siècles?) pour que ce soit devenu
trivial.

Question subsidiaire, peut-être idiote également: existe-t-il un GLM avec
une fonction de lien "binomiale négative". Ca me semblerait utile pour
traiter de données très agrégées comme le sont souvent les parasites...
Apparemment la fonction glm de R n'offre pas cette possibilité. Si elle
existe, serait-elle applicable en géostats pour le problème précité?

Bon, c'est tout pour aujourd'hui...

Bien cordialement à tous,

Patrick Giraudoux

Université de Franche-Comté
Laboratoire de Biologie environnementale
EA3184 usc INRA
F-25030 Besançon Cedex

tél.: +33 381 665 745
fax.: +33 381 665 797
http://lbe.univ-fcomte.fr

> Dave,
>
> Fantastic! Thanks for all those informations (including Cs). I am not sure
> that I will be capable to understand everything (eg a sight to the MCMC
> introduction make me feel how I would like to be better in maths...).
> However I really feel that not to handle those bloody binomial/Poisson
(even
> negbinomial) in the proper way of Geostats will limit our relevance on any
> spatial data set on prevalence or presence/absence distribution. I wonder
> how those trivial issues of epidemiology and ecology (= to predict a
> probability from such data) are fucking hell adressed properly in term of
> geostatistics by all those buggers who work on spatial data... can hardly
> believe it has never be done somewhere by someone!
>
> Keep in touch,
>
> Cheers,
>
> Patrick
>
>
> ----- Original Message -----
> From: "David Pleydell" <D.R.J.Pleydell@pgr.salford.ac.uk>
> To: <pgiraudo@univ-fcomte.fr>
> Sent: Saturday, December 20, 2003 9:10 PM
> Subject: Diggle Papers
>
>
> > Hi Patrick
> > I hope the journey home was smooth and painless. Regarding MCMC and
> > geostats I wonder if you've seen these papers?
> >
> > Childhood malaria in the Gambia: a case-study in model-based
geostatistics
> > Diggle P, Moyeed R, Rowlingson B, Thomson M
> > JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES C-APPLIED STATISTICS
> > 51: 493-506 Part 4 2002
> >
> > If your library doesn't have this journal a draft version of this paper
is
> > available from Peters web site...
> > http://www.maths.lancs.ac.uk/~diggle/papers/
> > ...the file is called "malaria.ps", it is in postscript format so you
will
> > need the (free) GhostView/Ghostscript software to read it.
> > On the same web site the data for the study are made publicly
> > available, if we start to use this MCMC technique then we should first
> try
> > to emulate their study to check we are doing things right.
> >
> > Also, this is worth reading: Introduction to MCMC.
> > http://www.math.auc.dk/~merete/SS-and-CM2001/pdgr.pdf
> >
> > If you work your way through THAT lot and still have a clear head then
you
> > are doing better than me!
> >
> > A bien tot
> > Dave
> >
> >
> >
> > ************************************************
> > David Pleydell
> > D 31 Peel Building
> > Telford Institute of Environmental Systems
> > School of Environment and Life Sciences
> > University of Salford
> > M5 4WT
> > phone: +44 161 2952094
> > fax: +44 161 295 5015
> >
>



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:45:27 MEST