Samir Messad a posé une question qui est générale :
>Je travaille sur un tableau faunistique qui range en ligne une quarantaine
>de lacs français dans lesquels on a echantillonné 22 espèces (les colonnes
>du tableau). On attribue à chaque lac-espece une note d'abondance qui
>correspond à la classe d'abondance relative de l'espèce (l'abondance
>relative d'une espèce est le rapport entre le nb de poissons de l'espèce et
>le nombre total de poissons pêchés dans le lac). Or, le découpage des
>classes d'abondance varie d'une espèce à l'autre.
C'est un problème pour de nombreuses situations.
Gérard de Belair (gerard_de_belair@yahoo.com) pose la même sous la forme :
>En faunistique, comment normaliser des données très
>hétérogènes au point de vue quantitatif (par ex.
>Ephemeroptera: 300 ind. et Rana viridis: 5 ind.), si
>nous voulons nous engager sur l'analyse multi-tab ou
>la recherche d'un compromis de stucture?
Dans la suite de son message Samir Messad ajoute une précision importante :
>Ma question : peut-on justifier d'analyser un tel tableau par l'AFC sachant
>que la note d'abondance codée 2 du brochet n'a pas la même signification
>(]0%-2%]) que celle du gardon (]0%-15%]) ?
>Est-ce que ça veut dire que le gardon, avec ses 4 modalités, va peser 2
>fois plus sur la
>constitution des axes et l'inertie totale, que le brochet (2 modalités) ?
>PS : une solution de codage est d'attribuer le même nombre de classes
>d'abondance (disons 4 : absence- peu présent - présence forte - présence
>très forte) mais avec des intervalles de classes différents entre espèces.
Il y a donc deux questions. La première porte sur le recodage en classe
d'abondance et la seconde sur l'utilisation de ce recodage comme variables
qualitatives. Mon opinion est que l'usage des variables qualitatives dans
l'analyse des tableaux faunistiques est à proscrire. Cette pratique très
particulière vient des sciences sociales. La majorité des questions dans
une enquête sont strictement qualitatives (Quelle est la CSP du chef de
famille ? Pensez-vous que les syndicats ont un rôle 1) trop important, 2)
normal, 3) insuffisant, ...) Les quelques variables non qualitatives sont
découpées en classes et mélangées aux autres dans le même type. Des
logiciels conçus pour cette discipline ont exporté la technique.
L'intérêt est dans la notion de profils écologiques. Les courbes de réponse
n'étant pas monotones sur les gradients écologiques, on peut préférer la
mise en classe des variables faunistiques et des variables mésologiques
pour utiliser les profils écologiques.
L'inconvénient est l'augmentation des dimensions (une variable à trois
classes compte pour deux variables, à m classes pour m-1 variables. Comme
la dimension espèce est déjà forte, elle est encore fortement augmentée.
Réduites à deux classes présence-absence, la technique de l'ACM sur
qualitatives est équivalente à l'ACP normée sur les quantitatives (0-1)
(Cailliez, F. & Pages, J.P. (1976) Introduction à l'analyse des données.
SMASH, 9 rue Duban, 75016 Paris. 1-616. p. 464). De plus, les statistiques
d'inertie en ACM sont fortement contraintes par la nature des données et
n'ont pratiquement aucun intérêt expérimental (en particulier la part
d'inertie est une fonction du nombre de modalités, l'inertie d'une modalité
est une fonction du nombre de porteurs, ... Lebart, L., Morineau, A. &
Piron, M. (1995) Statistique exploratoire multidimensionnelle. Dunod,
Paris. 1-439, p. 119). C'est pourquoi dans la doc d'ADE-4, il n'y pas un
seul exemple de cette pratique.
Si on compte les individus, il est logique de commencer par passer en
log(x+1) pour limiter le rôle de l'aggrégativité. Ensuite, si on considère
que la valeur de l'abondance d'une espèce n'a de valeurs que relatives, le
plus simple est de voir dans l'ensemble des notes d'abondance d'une espèce
la simple description de la répartition de l'espèce, c'est-à-dire son
profil (somme = 1). C'est en oeuvre dans l'analyse non symétrique des
correspondances (profils espèces : voir Gimaret-Carpentier, C., Chessel,
D., Pascal, J.P. & Ramesh, B.R. (1999) Advantages of Non-Symmetric
Correspondence Analysis in identifying multispecific spatial patterns in
the rain forest of the Western Ghats. In : Data management and modelling
using remote sensing ans GIS for tropical forest land inventory. Laumonier,
Y., King, B., Leggs, C. & Rennols, K. (Eds.) Rodeo International
Publishers, Jakarta. 397-411. Gimaret-Carpentier, C., Chessel, D. &
Pascal, J.P. (1998) Non-symmetric correspondence analysis: an alternative
for community analysis with species occurrences data. Plant Ecology : 138,
97-112. ou l'article remarquable dans un autre domaine de Kroonenberg, P.M.
& Lombardo, R. (1999) Nonsymmetric correspondence analysis: a tool for
analysing contingency tables with a dependence structure. Multivariate
Behavioral Research : 34, 367-396). C'est aussi en oeuvre dans le module
Niche (voir Dolédec, S., Chessel, D. & Gimaret, C. (1999) Niche separation
in community analysis: a new method. Ecology : (in press))
L'AFC du tableau des valeurs recodées (COA: COrrespondence Analysis) est
donc préférable à l'ACM (MCA: Multiple Correspondence Analysis) des valeurs
recodées définissant des classes. Et les ACP (Niche: Species Profiles PCA)
ou AFC (COA: NSCA_Col_Profiles) sur profils espèces sont meilleures que
l'AFC et le recodage est automatique.
Par contre les versions K-tableaux ne sont pas encore implantées, mais ça
viendra.
Cordialement
Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77 - (33) 4 72 44 82 77
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:02 MET