Re: Between group analysis

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jun 08 2004 - 16:21:30 MEST


At 09:06 08/06/2004 +0200, Florent BATY wrote:
>Je travaille actuellement sur des donnees de puces a ADN et je souhaite classer 3 groupes distincts de malades a l'aide de donnees d'expression de genes. Je travaille sur 24 patients repartis dans 3 groupes et a partir de l'expression de 45 genes. Afin de separer les differents malades en fonction de leur appartenance a l'un des trois groupes, j'utilise une Between analysis suite a une PCA.
>J'aimerais maintenant pouvoir calculer un parametre qui fournirait une information sur l'importance et la qualite de la discrimination apportee par l'analyse. Je pensais par exemple comparer les inerties intra-groupe, inter-groupes et totale. Je pensais aussi etudier le rapport entre l'inertie inter-groupe et l'inertie totale.
>J'ai vu que la fonction 'between' dans ADE4 sous R fournit la valeur 'ratio'. A quoi correspond exactement ce parametre. S'agit-il du rapport de l'inertie inter-groupe sur l'inertie totale ?

oui, la fonction a quelques lignes. On peut lire :
X$ratio <- sum(X$eig)/sum(dudi$eig)

La somme des valeurs propres de départ est l'inertie totale.

data(meaudret)
sum(pca1$eig)
[1] 9
Une ACP normée a comme inertie le nombre de variables
pca1 <- dudi.pca(meaudret$mil, scan = FALSE, nf = 4)

La somme des valeurs propres de l'analyse du tableau des centres des classes est l'inertie inter-classes
bet1 <- between(pca1, meaudret$plan$sta, scan = FALSE, nf = 2)
sum(bet1$eig)
[1] 3.425

bet1$ratio
[1] 0.3805
 3.425/9
[1] 0.3806

Comme les variables sont normalisées, ici c'est aussi le pourcentage moyen de variance expliquée pour chacune des variables par la partition :
sum(apply(meaudret$mil,2,function(x) summary(lm(x~meaudret$plan$sta))$r.squared))/9
[1] 0.3805

>Si oui, quelle distance est ici utilisee pour calculer les inerties ?

La distance utilisée est celle du dudi qui génère la between : la pondération des variables est conservée de l'analyse simple à l'analyse inter-classe d'où l'ACP inter-classe, l'AFC inter-classes, l'ACM inter-classes ...

Daniel Chessel - chessel@biomserv.univ-lyon1.fr



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:30:56 MEST