Re: Déformation dune structure Coefficient RV

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Jun 26 2003 - 08:36:36 MEST


At 12:21 25/06/2003 +0000, Olivier Beauchard écrit:
>Bonjour,
>
>Je dispose de 3 tableaux faunistiques 1, 2 et 3 de dimensions respectives 154*53, 154*133 et 154*287 (codés en 0/1). Il y a donc 154 sites suivant 3 points de vue (3 structures). L’intérêt est porté sur les sites et l’objectif est de réaliser 2 comparaisons :
>- tableau 1/tableau 3
>- tableau 2/tableau 3
>sachant que la structure 3 est considérée comme structure de référence. Il s’agit donc de quantifier le « décalage » global des sites d’un nuage à l’autre.
>
>J’ai songé à une logique de co-inertie en calculant le coefficient RV de chaque comparaison (sans le tester). Ces coefficients sont disponibles dans plusieurs fonctions d’ADE mais j’hésite quant à celle qu’il faut utiliser dans ce cas de figure. J’ai essayé « à taton » des manières suivantes :
>
>1) Par STATIS en initiant un .ktta (53+133+287)*154 issu d’un *.flta 154*(53+133+287) qui pondère de façon uniforme les lignes-sites devenant colonnes dans le K-tableau
>
>2) Par la méthode des K+1 tableaux (*.fcta 154*287 confronté à *.ktta (53+133)*154 issu de .flta 154*(53+133) pondéré par *.fcpl 154*287).
>
>3) Par Canonical \ RV coefficients
>
>Dans les 3 cas les RV sont forts mais sensiblement différents (quoique plus ressemblant entre 1) et 2)). Ces écarts observés entre les 3 démarchent sont-ils dus à un détail technique négligeable ou autre chose ?

La question est très bien posée. Et elle n'est pas près d'être résolue.

A l'origine, on trouve le couple tragique ACP-AFC sur un tableau faunistique.
L'ACP a l'avantage de la pondération uniforme mais l'inconvénient de la transformation préalable très ouverte
L'AFC ne pose pas de questions mais impose des pondérations propres au tableau.

D'aucun disent que ni l'une ni l'autre ne peuvent se comparer à une PCO sur une distance appropriée.

Quand on a deux tableaux faunistiques le problème n'est pas simplifié, c'est moins que l'on puisse dire.
A preuve le remarquable article à paraître
ter Braak, C.J.F. and A.P. Schaffers, Co-correspondence analysis: a new ordination method to relate two community compositions. Ecology, 2003. in press.
(preprint à cajo.terBraak@wur.nl)

D'où la présence de plusieurs essais dans ade-4 de coordonner des tableaux faunistiques. Par le biais des tableaux flous (mêmes sites) ou des intra-classes (mêmes espèces). Les résultats ne sont pas identiques et c'est normal. Peut-être l'essentiel avant la discussion entre tableaux est le choix de la méthode pour un seul tableau. Sans décision précise à ce niveau, aux étages suivants, c'est franchement le brouillard.
Comment choisir ? On peut organiser un colloque, tant les avis sont partagés. Si les espèces sont là pour faire de la typologie de sites (et rien de plus) les méthodes par distances peuvent s'imposer. Mais c'est très ouvert et chaque cas sera particulier. Avec un tableau de référence, les rotations procustéennes qui envoient sans déformation un nuage sur un autre sont certaiment souhaitables. Utiliser alors la fonction procuste de ade-4 dans R et les indications de Dray, S., D. Chessel, and J. Thioulouse, Procustean co-inertia analysis for the linking of multivariate datasets. Ecoscience, 2003. 10: p. 110-119.

>Par ailleurs, mis à par le but de certaines méthodes comme STATIS (recherche d’un compromis de référence, mais qui n’est pas là mon objectif), je cherche un (ou 2 ?) système(s) d’axes permettant quantifier le « décalage » individuel de chaque site d’un nuage à l’autre. Est-ce possible ?

Un des principaux sujets de recherche en statistique pour les 25 ans à venir !
Il ne semble pas qu'on ait actuellement dépasser la notion de compromis entre deux structures.
Mais la question a été et est posée en analyse sensorielle. Des juges induisent des matrices de distances entre produits et on se pose la question de la composante personnelle introduite par un juge dans sa propre typologie. Avec P. Bady, on essaye de réfléchir à ces questions en écologie. Quelques références bibliographiques :

Wemelsfeder, F., et al., The spontaneous qualitative assessment of behavioural expressions in pigs: first explorations of a novel methodology for integrative animal welfare measurement. Applied Animal Behaviour Science, 2000. 67: p. 193-215.
Gower, J.C., Generalized procustes analysis. Psychometrika, 1975. 40: p. 33-51.
Kiers, H.A.L. and J.M.F. ten Berge, Hierarchical relations between methods for simultaneous component analysis and a technique for rotation to a simple simultaneaous structure. British Journal of Mathematical and Statistical Psychology, 1994. 47: p. 109-126.
Martin, M., et al., Comparison of odour sensory profiles performed by two independent trained panels following the same descriptive analysis procedures. Food Quality and Preference, 2000. 11: p. 487-495.
Meyners, M., J. Kunert, and E.M. Qannari, Comparing generalized procustes analysis and statis. Food Quality and Preference, 2000. 11: p. 77-83.
Qannari, E.M., et al., Comparaison de trois stratégies de détermination d'un compromis en évaluation sensorielle. Revue de Statistique Appliquée, 1997. 45: p. 61-74.
Schönemann, P.H., An algebraic solution for a class of subjective metrics models. Psychometrika, 1972. 37: p. 441-451.
ten Berge, J.M.F., Orthogonal Procustes rotation for two or more matrices. Psychometrika, 1977. 42: p. 267-276.
ten Berge, J.M.F. and P.A. Bekker, The isotropic scaling problem in Generalized Procustes Analysis. Computational Statistics and Data Analysis, 1993. 16: p. 201-204.

Franchement pas simple, c'est tout ce qu'on peut faire pour le moment
mais la question est vraiment importante

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:45:23 MEST