Re: analyse spatiale

From: Clément Calenge (calenge@biomserv.univ-lyon1.fr)
Date: Fri Sep 10 2004 - 11:11:58 MEST

  • Next message: Daniel Chessel: "Re: analyse spatiale"

    Bonjour,

    >Je travaille sur les facteurs environnementaux de risque de Fièvre de la
    >vallée du Rift (une maladie du bétail transmise par un moustique vecteur)
    >au Sénégal. Voici mon problème: nous avons fait des prélèvements sur des
    >animaux, dans une échantillon de 16 campements, dans notre zone d'étude.
    >Le nombre d'animaux prélevés était de 50 par campement. Nous savons donc
    >quels campements sont positifs ou négatifs, et quelle est l'incidence
    >saisonnière de la maladie dans chaque campement. J'ai par ailleurs des
    >données environnementales issues d'images satellites. je voudrais étudier
    >le lien entre certaines variables environnementales (ex: distance et type
    >des mares les plus proches, présence de végétation arborée autour du
    >campement, etc.) et l'occurence (ou l'incidence, à voir) de la maladie.
    >J'avais pensé à faire une régression logistique (variable expliquée =
    >présence/absence de maladie), mais est ce possible avec seulement 16
    >observations? Si non, existe-t'il une autre méthode?
    >Merci beaucoup,

    La question de savoir comment mettre en relation la présence d'une espèce avec
    des variables environnementales a été très discutée dans la littérature
    écologique, et
    il est difficile de répondre à votre question sans avoir une vue plus
    précise des données.
    Quoi qu'il en soit, une régression logistique sur seulement 16 observations
    ne me paraît
    pas être une bonne solution, surtout si l'on considère qu'il y a plusieurs
    variables
    environnementales (combien?).

    En effet, le nombre de variables qu'on peut intégrer dans un
    modèle linéaire généralisé (dont la régression logistique est un cas
    particulier)
    dépend du nombre d'observations disponibles. Dans leur ouvrage de référence,
    Burnham & Anderson (1998: p. 196) indiquent:
    "As a rule of thumb, and this is liberal, the maximum number of structural
    parameters
    to allow in a regression (or other univariate) model should be n/10. It is
    not possible to
    reliably estimate anything like n/2 (or n/3) parameters from 'noisy data'".
    (Source: Burnham K.P. & Anderson D.R. (1998) Model selection and inference.
    Springer, Berlin.)
    Selon cette "rule of thumb", avec 16 points, intégrer une seule variable
    environnementale dans le modèle,
    c'est déjà presque trop (avec l'ordonnée à l'origine, ça fait deux paramètres).

    Par ailleurs, un point important à considérer est la structuration dans
    l'espace de l'incidence
    de la maladie (comme le souligne le titre de votre mail). Peut-être
    faudrait il commencer par
    mesurer l'autocorrélation spatiale de l'incidence, en utilisant par exemple
    l'indice de Moran ou de Geary
    (cf. ftp://pbil.univ-lyon1.fr/pub/mac/ADE/ADE4/DocThemPDF/Thema73.pdf
    ou http://pbil.univ-lyon1.fr/R/stage/stage8.pdf). S'il y a autocorrélation,
    autrement dit, si la probabilité de
    contamination d'un campement est liée à la présence d'un campement
    contaminé à proximité
    (contagion), alors cela interdit définitivement l'utilisation de la
    régression logistique, qui repose sur
    l'hypothèse d'indépendance entre les observations. Dans ce cas, il faudrait
    d'abord chercher à mettre
    en évidence les foyers de la maladie au niveau spatial (e.g. avec des
    méthodes de lissage).

    C'est après cette étape que vous pourrez essayer de mettre en relation
    l'incidence ou
    l'occurrence de la maladie avec les variables de milieu, au moins de façon
    exploratoire (par exemple en effectuant une ACP inter-classes:
    un tableau contenant les variables environnementales en variables à
    expliquer, et la variable occurrence
    - ou incidence -en explicative), à condition que le nombre de campements
    dans chaque catégorie soit à peu près
    équilibré. Mais gardez en tête que cette analyse ne
    sera qu'exploratoire (à cause du faible nombre d'observations).
    Cordialement,

    Clément Calenge

    ======================================
    UMR CNRS 5558 - Equipe "Ecologie Statistique"
    Laboratoire de Biométrie et Biologie Evolutive
    Université Claude Bernard Lyon 1
    43, Boulevard du 11 novembre 1918
    69622 Villeurbanne Cedex
    FRANCE
    tel. (+33) 04.72.43.27.57
    fax. (+33) 04.72.43.13.88



    This archive was generated by hypermail 2b30 : Fri Sep 10 2004 - 11:14:34 MEST