Re: ACP standard ou centree?

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Mon Mar 09 1998 - 14:45:17 MET


La question de Slim Masmoudi permet de rappeler que le choix entre une ACP
standard et une ACP centrée est simple seulement dans certains cas.
1) quand les unités des différentes variables sont quelconques, les
variances dépendent des unités et la seule possibilité est de normer.
2) quand les variances des variables sont toutes égales, les deux options
donnent le même résultat et le choix est indifférent.
3) quand les variances sont différentes mais comparables (cas des tableaux
faunistiques) on centre en général car les variables normées issues des
séries avec beaucoup de zéros n'ont pas de bonnes qualités statistiques.

Il est, ceci dit, en général impossible de dire qu'on a utilisé LA bonne
méthode. On peut toujours approcher la réalité de plusieurs manières
différentes qui conduisent à des conclusions voisines. LA bonne méthode
n'existe pas. De plus, la même méthode peut se défendre pour obtenir des
résultats totalement opposés dans deux cas différents. Par exemple, on peut
faire une ACP pour dire "les variables ne sont pratiquement pas corrélées,
donc ..." ou pour dire "Les variables sont fortement corrélées, donc ...".
Une méthode descriptive comme l'ACP n'est pas bonne ou mauvaise en soi (pas
plus que de faire un histogramme, ça fait rarement du mal). Dans le cas de
Slim, normer donne la même poids à toutes les questions (et peut donc en
donner trop à certaines), ne pas normer laisse les grandes variances jouer
un rôle plus grand (et parfois trop grand). Tout ceci dépend des objectifs,
des données et des résultats.

>J'ai fait un questionnaire destine a des informaticiens, dans le but
>d'etudier leur activite de debugging.
>La diffusion de ce questionnaire qui contient 25 variables a modalites
>ordonnees, a permis de recueilir 25 questionnaires remplis.
>Les modalites sont du style :
>Exemple 1 :
***
>Apres le recodage, j'ai fait une ACP standard (sur matrice de
>correlations) afin de synthetiser les 25 variables de depart en
>variables principales.
>
>L'analyse m'a permis d'identifier 5 composantes principales.
>
>En partant du fait de mon ignorance de la difference entre l'ACP
>standard et centree;
>d'une part, je ne sais pas s'il aurait fallu que je fasse une ACP
>centree,
>d'autre part, si on me demande pourquoi vous avez fait une ACP standard,
>je ne sais pas repondre.
>
>Est ce que ma demarche est bonne? et est ce que vous pouvez m'aider a
>avoir de bons arguments?

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:52 MET