Bonjour,
>Je travaille sur les facteurs environnementaux de risque de Fièvre de la
>vallée du Rift (une maladie du bétail transmise par un moustique vecteur)
>au Sénégal. Voici mon problème: nous avons fait des prélèvements sur des
>animaux, dans une échantillon de 16 campements, dans notre zone d'étude.
>Le nombre d'animaux prélevés était de 50 par campement. Nous savons donc
>quels campements sont positifs ou négatifs, et quelle est l'incidence
>saisonnière de la maladie dans chaque campement. J'ai par ailleurs des
>données environnementales issues d'images satellites. je voudrais étudier
>le lien entre certaines variables environnementales (ex: distance et type
>des mares les plus proches, présence de végétation arborée autour du
>campement, etc.) et l'occurence (ou l'incidence, à voir) de la maladie.
>J'avais pensé à faire une régression logistique (variable expliquée =
>présence/absence de maladie), mais est ce possible avec seulement 16
>observations? Si non, existe-t'il une autre méthode?
>Merci beaucoup,
La question de savoir comment mettre en relation la présence d'une espèce avec
des variables environnementales a été très discutée dans la littérature
écologique, et
il est difficile de répondre à votre question sans avoir une vue plus
précise des données.
Quoi qu'il en soit, une régression logistique sur seulement 16 observations
ne me paraît
pas être une bonne solution, surtout si l'on considère qu'il y a plusieurs
variables
environnementales (combien?).
En effet, le nombre de variables qu'on peut intégrer dans un
modèle linéaire généralisé (dont la régression logistique est un cas
particulier)
dépend du nombre d'observations disponibles. Dans leur ouvrage de référence,
Burnham & Anderson (1998: p. 196) indiquent:
"As a rule of thumb, and this is liberal, the maximum number of structural
parameters
to allow in a regression (or other univariate) model should be n/10. It is
not possible to
reliably estimate anything like n/2 (or n/3) parameters from 'noisy data'".
(Source: Burnham K.P. & Anderson D.R. (1998) Model selection and inference.
Springer, Berlin.)
Selon cette "rule of thumb", avec 16 points, intégrer une seule variable
environnementale dans le modèle,
c'est déjà presque trop (avec l'ordonnée à l'origine, ça fait deux paramètres).
Par ailleurs, un point important à considérer est la structuration dans
l'espace de l'incidence
de la maladie (comme le souligne le titre de votre mail). Peut-être
faudrait il commencer par
mesurer l'autocorrélation spatiale de l'incidence, en utilisant par exemple
l'indice de Moran ou de Geary
(cf. ftp://pbil.univ-lyon1.fr/pub/mac/ADE/ADE4/DocThemPDF/Thema73.pdf
ou http://pbil.univ-lyon1.fr/R/stage/stage8.pdf). S'il y a autocorrélation,
autrement dit, si la probabilité de
contamination d'un campement est liée à la présence d'un campement
contaminé à proximité
(contagion), alors cela interdit définitivement l'utilisation de la
régression logistique, qui repose sur
l'hypothèse d'indépendance entre les observations. Dans ce cas, il faudrait
d'abord chercher à mettre
en évidence les foyers de la maladie au niveau spatial (e.g. avec des
méthodes de lissage).
C'est après cette étape que vous pourrez essayer de mettre en relation
l'incidence ou
l'occurrence de la maladie avec les variables de milieu, au moins de façon
exploratoire (par exemple en effectuant une ACP inter-classes:
un tableau contenant les variables environnementales en variables à
expliquer, et la variable occurrence
- ou incidence -en explicative), à condition que le nombre de campements
dans chaque catégorie soit à peu près
équilibré. Mais gardez en tête que cette analyse ne
sera qu'exploratoire (à cause du faible nombre d'observations).
Cordialement,
Clément Calenge
======================================
UMR CNRS 5558 - Equipe "Ecologie Statistique"
Laboratoire de Biométrie et Biologie Evolutive
Université Claude Bernard Lyon 1
43, Boulevard du 11 novembre 1918
69622 Villeurbanne Cedex
FRANCE
tel. (+33) 04.72.43.27.57
fax. (+33) 04.72.43.13.88
This archive was generated by hypermail 2b30 : Fri Sep 10 2004 - 11:14:34 MEST