Re: ACP inter et intra classe

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Jul 19 2002 - 08:58:03 MEST


At 15:57 18/07/2002 +0200, o.baudier wrote:

   Actuellement en stage de DESS Qualité et Traitement des Eaux
>et des Bassins Versant (Université de Besançon) à la DR 8 du
>Conseil Supérieur de la Pêche (34), j'étudie l'organisation
>longitudinale des peuplements pisciaires au niveau de la zone
>méditerranéenne. Dans ce cadre, j'essaie de tester la
>pertinence du classement des peuplements selon divers systèmes
>dans le but de déterminer quels grands types de facteurs
>influent le plus la répartition de ces peuplements. La
>technique d'analyse que j'ai retenue est une approche en ACP
>inter et intra classe avec étude de la décomposition de la
>variance par les 1ères valeurs propres des ACP. (pour
>information, les systèmes de classement retenus sont : par
>Niveaux Typologiques Observés (Verneaux, 1973, 1976a-b, 1977 a-
>b...), par grand bassin hydrographique, et par région
>biogéographique).

On pourrait penser à une pétition de principe. Pourquoi traiter les données
puisque le modèle de ces données est déjà établi. La seule fonction
sérieuse de l'analyse des données est de faire sortir un modèle
d'organisation de l'information numérique. Quand on possède un tel modèle
on n'a plus besoin d'analyse. Sauf pour "mettre la sauce" ou "pour faire un
exo" ?

> Le problème que je rencontre est le suivant : Je travaille à
>partir d´un tableau de contingence inventaires/poissons en
>densité ou en biomasse estimées,

Le terme est impropre : dans une table de contingence on ne trouve que des
effectifs et c'est l'extension de l'usage de l'analyse des correspondances
des tables de contingence aux tableaux d'abondance qui génère la confusion.

> réunissant des données
>relatives à des stations exemptes de perturbations
>anthropiques notoires. Comme vous pouvez l´imaginer, ces
>situations ne font pas légion, mon jeu de donnée s´en trouve
>un peu déséquilibré (beaucoup de station au niveau des têtes
>de bassin, quelques-unes unes dans les zones médianes et
>aucune dans les parties potamiques). J´en viens donc aux
>questions que je voulais vous poser :
>Ø L´analyse inter intra classe est-elle biaisé par ce
>déséquilibre entre la taille des blocs formés pour l´analyse ?

Le mélange de vocabulaire ne simplifie pas les choses. Un estimateur est
biaisé, si en moyenne, il ne donne pas la valeur exacte d'un paramètre,
mais une analyse qui définit une manière de regarder les données peut-elle
être biaisée ? La contrainte introduite par le point de vue de J. Verneaux
est fondamentale. Les détails techniques qui en découlent sont mineurs.

>Ø Si c´est le cas, existe-t-il dans ADE une manière de
>pondérer les blocs afin d´analyser l´ensemble de mon jeu de
>donné sans perdre d´informations en travaillant sur un jeu
>plus restreint ( ce qui impliquerait un choix des inventaires,
>opération qui me paraît un peu subjective au sein de la
>démarche adoptée) ?
>
>Ø Une subtilité du raisonnement m´aurait-elle échappé
>dans l´approche que j´ai choisie ?

Pourquoi vouloir limiter le rôle d'un point de vue introduit a priori ? Ces
questions bizarres ne se posent que par le choix initial. Ce choix est
tellement fort qu'il n'y a plus de données à traiter (du genre station
potamique sans perturbation anthropique). Les difficultés viennent de ce
que la statistique porte sur les données et non sur ce qu'on en pense.

>Une dernière question qui rentre aussi dans le cadre de mon
>stage :
>
>Ø Dans le cas d´une analyse de listes faunistiques en
>présence/absence, l´AFC « classique » est-elle l´outil le plus
>adapté à la mise en évidence d´une typologie station / espèce ?

Question intéressante et très ouverte. La thèse de J. Verneaux est très
instructive sur ce point. Dans un univers déjà fortement dégradé par la
pollution, il cherche un modèle théorique de l'organisation des communautés
qui se cache derrière la réalité. L'AFC est sans doute un bon moyen, très
contraignant derrière une façade trompeuse de neutralité. La typologie vue
par J. Verneaux est une construction abstraite et l'AFC l'aide beaucoup en
débarassant les données des effets de la pollution. Ceci est souvent décrit
dans la doc thématique d'ade4.

Dans un "DESS Qualité et Traitement des Eaux", ce n'est pas forcément ce
point de vue fondamental qui est en jeu. Pour décrire la réalité, l'ACP est
plus efficace et moins sophistiquée. Les questions ici posées sont
faussement techniques.

Daniel Chessel



This archive was generated by hypermail 2b30 : Fri Feb 14 2003 - 14:36:10 MET