AFC_et_profils_lignes

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Mar 04 1997 - 09:45:18 MET


Bonjour,

Je reviens sur la question de Gilles CRAGUE :

>IL s'agit d'une petite question theorique au sujet de l'AFC. Dans la carte
>postale COA, l'AFC est presentee comme l'analyse d'un triplet (Z, Dn, Dp)
>avec Z de terme general Fij/(Fi.*f.j)-1, Dn=Fi. et Dp=F.j. Or j'ai pu lire
>par ailleurs (Lebart, Morineau, Piron, Statistique exploratoire
>multidimensionnelle) que l'AFC est presentee comme l'analyse du tableau de
>terme general Fij/Fi. - F.j avec la metrique inv(Dp) et les poids Dn pour
>le nuage des lignes, la metrique inv(Dn) et les poids Dp pour le buage des
>colonnes. Quel est le lien entre ces deux manieres de voir l'AFC (la
>seconde maniere est facilement visualisable comme l'analyse du nuage de
>l'ecart des profils-lignes (ou colonnes) au profil moyen, alors que la
>seconde est plus difficilement visualisable a mon sens) ? Le module COA (et
>les fichiers qu'il engendre) de ADE-4 peut-il etre utilise en reference a
>la seconde maniere de voir l'AFC ?

D'abord pour remercier Gilles Yoccoz de sa remarque. En revenant à l'analyse des correspondances comme analyse discriminante, ce qui revient à dire
---------------
Donner un score aux colonnes du tableau de variance unité pour la pondération des colonnes de manière à ce que les moyennes par lignes soient de variance maximale (avec la pondération des lignes)
---------------
il fallait citer Sir Ronald Fisher :

Fisher, R.A. (1940) The precision of discriminant functions. Annals of Eugenics : 10, 422-338.

Le point de vue de Lebart, L., Morineau, A. & Piron, M. (1995) Statistique exploratoire multidimensionnelle. Dunod, Paris. 1-439 cité est exactement celui-là et Fisher en est l'inventeur. Il y a un article de J.C. Gower

Gower, J.C. (1990) Fisher's optimal scores and multiple correspondence analysis. Department of Data Theory, University of Leiden. 1-21.

qui fait le point sur cette question. Je ne sais pas si Gilles Yoccoz a la référence définitive de l'article de Gower.

Pour obtenir ces scores de variance 1, il faut utiliser DDUtil : Add normed scores exectement comme dans le question de M. HOSTETLER. Le .fcc1 place les colonnes avec une variance 1 et le .fcli place les lignes à la moyenne avec une variance maximum. C'est exactement la version AFC des relations entre le .cnc1 et le .cnli de la version ACP normée.

Ensuite pour rappeler un fait étrange: le triplet statistique des profils lignes est aussi programmé dans l'option COA : Row_%_Triplet qui a été rajouté et est actuellement disponible. Ceci permettra aux amateurs de comparer et souligne un point d'importance. Dés que de l'information supplémentaire est ajouté du côté des lignes ou du côté des colonnes d'une analyse des correspondances, il s'introduit une dissymétrie et on sort du modele de l'analyse canonique. Par exemple pour faire une analyse discriminante (par paquets de lignes) sur un tableau d'AFC il faut partir enchainer COA : Row_%_Triplet et Discrimin : Discriminant analysis/Run. Il y a alors deux couches d'averaging qui se résume à
---------------
Donner un score aux colonnes du tableau de manière à ce que les moyennes par lignes soient de variance unité (avec la pondération des lignes) de manière à ce que les moyennes par classes soit de variance maximale (avec la pondération des classes). On a une méthode de discrimination de profils lignes et le schéma de départ est celui des profils lignes. (fiche thématique 5-6 utilisée dans Perrière, G., Lobry, J.R. & Thioulouse, J. (1996) Correspondence discriminant analysis: a multivariate method for comparing classes of protein and nucleic acid sequences. Computer Applications in the BIOSciences : 12, 519-524)
---------------

Evidemment le fait que l'AFC soit une analyse discriminante, qu'il existe une analyse discriminante des correspondances, que l'AFC soit une analyse canonique et que l'analyse canonique des correspondances de Ter Braak ne soit pas une analyse canonique, que l'analyse discriminante soit un cas particulier d'analyse canonique ... ne simplifie pas la discussion !

Une révision du vocabulaire s'impose.

Cordialement

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:27 MET