Re: Biplot ACP

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Mon Jan 05 2004 - 18:21:07 MET


At 12:49 05/01/2004 +0100, Philippe Aubry wrote:
>J'aimerais savoir si quelqu'un peut me donner un avis éclairé sur la façon dont le biplot est construit dans le Lebart, Morineau et Piron (1997), 2ème édition :
>
>p. 48 on peut lire :
>
>"si l'échelle des coordonnées des points-variables a une interprétation en termes de corrélations, il n'en n'est pas de même pour les points-individus. On appliquera à leurs coordonnées un coefficient de dilatation convenable. La valeur sqrt(n/p) assure souvent un positionnement dans le plan compatible avec la répartition des points variables et permet ainsi une représentation équilibrée des deux nuages."
>
>Autant le biplot de corrélation au sens du biplot de Gabriel est pafaitement clair sur le plan formel, autant ici j'ai le sentiment qu'il s'agit d'une méthode 100% empirique. Me trompe-je ? Que dois-je penser d'une telle méthode ?

Intéressante question qui demande une explication.
Les auteurs cités indiquent que le biplot est la projection simultanée de la base canonique de Rp et du nuage de points. Ceci est parfaitement légitime et très curieusement, il n'y a pas trace de cette approche géométrique dans les travaux de Gabriel (en particulier Gabriel, K. R. 1971. The biplot graphical display of matrices with application to principal component analysis. - Biometrika 58: 453-467) qui donne la même indication pour une raison tout à fait différente. En terme de dudi.pca, cela revient à superposer $li et $c1.

Gabriel donne une autre indication qui revient à faire exactement la même chose dans Rn avec la carte des variables ($co) et la base canonique de Rn ($l1). Il y a donc deux biplots canoniques avec soit
sqrt(lambda1)*l1 et c1 soit l1 et sqrt(lambda1)*c1. Gabriel envisage même tous les biplots qui ont le même pouvoir du type alpha*l1 et (sqrt(lambda1)/alpha)*c1 avec alpha compris entre 1 et sqrt(lambda1).

Personnellement je pense que le biplot li+c1 ou co+l1 sont justifiés. Mais au plan graphique, on a une difficulté si une des deux représentation est microscopique par rapport à l'autre. Et concrètement il est légitime de dilater arbitrairement une des deux représentations pour qu'elle occupe un espace voisin de l'autre. C'est ce que disent les excellents auteurs cités et ce n'est pas du bricolage. Quelle importance de représenter le vecteur ek ou 10*ek ou 100*ek pour qu'on puisse le voir sur le dessin (avec les étiquettes). Le tout est que ce soit sans déformation donc avec un coefficient constant. Dans les scatter génériques de ade4 dans R, j'ai choisi de calculer arbitrairement un coefficient de dilatation pour ajuster les deux graphes (sans parler de cette dilatation). Il faudrait voir ce que la fonction générique biplot de la librairie mva de R fait. Elle a deux méthodes :
methods (biplot)
[1] biplot.default* biplot.princomp*

Celle qui nous intéresse est biplot.princomp. Mais

Non-visible functions are asterisked
biplot.princomp
Error: Object "biplot.princomp" not found

Il faudrait aller fouiller dans les sources pour avoir une idée précise.
L'empirisme de Lebart vient d'une nécessité graphique et n'est pas une concession à l'empirisme.
C'est un problème un peu compliqué par la présence de plusieurs logiques (algèbre et dessin)

Bonne année

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:30:56 MEST