coinertie et régression logistiqe multiple

From: Philippe Choler (philippe.choler@ujf-grenoble.fr)
Date: Fri Jan 19 2001 - 16:03:22 MET


Bonjour à tous,

Utilisateur d'ADE, je me permets de vous interroger sur le point suivant:

Mon objectif est de discriminer la niche de deux écotypes connus (A et B)
d'une plante que l'on trouve dans les pelouses alpines. Il existe des
différences morphologiques qui permettent d'identifier ces deux écotypes
sur le terrain.

A ma disposition:
-une matrice environnementale "X" de 938 relevés lignes et 6 variables
colonnes. les variables sont du type semi-quantitatif (qualitatif ordonné).

-une matrice floristique "Y" de 938 relevés lignes et 200 espèces colonnes.
Tous ces relevés ont été effectués dans les pelouses alpines selon un
échantillonage plus ou moins stratifié par les 6 variables précédentes.
l'écotype A se retrouve dans 20% des relevés et l'écotype B dans 15% des
relevés. Aucun relevé ne comporte les deux écotypes ensemble.

J'ai fait deux analyses de couplage entre X et Y:
- soit avec le module CoInertia ("Redundancy Analysis" après traitement de
"X" par PCA covariance matrix et "Y" par PCA correlation matrix)
- soit avec le module CCA après traitement de "Y" par COA et traitement de
"X" par PCA covariance matrix avec pondération des lignes par le fichier .fcpl

Rien que de très classique donc de la part d'un lecteur attentif de la
documentation thématique d'ADE. Le dépouillement des différentes analyses
donne des résultats très concordants et biologiquement intéressants: bon %
de variance expliquée par les variables, bonnes corrélations entre axes de
coinertie et axes des ordinations simples et surtout bonne "séparation" des
niches sur les différents plans de projection.

Chaque niche me semble donc désormais définie de façon satisfaisante grâce
à la prise en compte des variables floristiques et environnementales.
C'était le but au départ.

Bon maintenant mon attention se focalise sur les relevés "qui posent
problème": c'est à dire les relevés avec un écotype A qui se positionnent à
"proximité" du nuage des relevés avec l'écotype B dans l'espace de
coinertie et réciproquement...

J'ai bien entendu des moyens de quantifier "l'excentricité" de ces relevés
en calculant par exemple leur distance au centre de gravité de chaque
écotype etc...

Mais ce que j'aimerais c'est un "truc" qui me permette de déterminer une
probabilité d'avoir l'écotype A ou l'écotype B connaissant les coordonnées
d'un relevé dans l'espace de coinertie.

Benoîtement, je me suis dit: "1) j'enlève les deux écotypes de la matrice
Y de départ 2) je refais l'analyse de coinertie (PCA-PCA) 3) je prends les
coordonnées des 938 relevés sur les 3 axes significatifs de l'analyse de
coinertie (le fichier .iil2) comme variables explicatives 4) je "réinjecte"
les données en présence-absence de chaque écotype comme variables binaires
à expliquer et 5) j'effectue une régression logistique multiple. J'obtient
un modèle qui me permets d'affecter à chaque relevé une probabilité d'avoir
A , B ou ni A ni B"

Ma question est simple: Est-ce que l'on joue à l'apprenti-sorcier lorsque
l'on fait ce genre de manip ?

Merci par avance pour une réponse compréhensible par un utilisateur n'ayant
pas le sentiment de maîtriser tous les fondements théoriques de l'analyse
multivariée.

Bien cordialement

______________________________________________________________________
Philippe CHOLER

Laboratoire de Biologie des Populations d'Altitude UMR UJF-CNRS 5553
& Station Alpine du Lautaret (Jardin Botanique Alpin et Chalet-Laboratoire)

Université J. Fourier - Grenoble I
Bâtiment D de Biologie - BP 53 X - 38041 GRENOBLE cedex 09 -
FRANCE

tel 04 76 51 49 40 - foreign countries: +33 4 76 51 49 40
fax 04 76 51 42 79 - foreign countries: +33 4 76 51 42 79
@mail <philippe.choler@ujf-grenoble.fr>

http://www.ujf-grenoble.fr/JAL/Choler/perso/cv.htm
_______________________________________________________________________



This archive was generated by hypermail 2b30 : Thu Jul 04 2002 - 09:39:08 MEST