Coefficients RV (Re : O Raymond)

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Wed Jan 20 1999 - 11:36:04 MET


La question posée par Olivier Raymond permet de rappeler la définition d'un coefficients RV. Entre deux variables la correlation est

r(x,y)=cov(x,y)/sqrt(var(x)var(y))

Entre deux tableaux le coefficient RV vaut

RV(X,Y)=COVV(X,Y)/sqrt(VAV(X)VAV(Y))

Ainsi si le tableau X est
1 0
0 1
-1 0
0 -1
avec les poids 1/4 sur les lignes et 1/2 sur les colonnes
VAV(X) = 1/8
Pour Y
2 0
0 2
-2 0
0 -2
VAV(Y) = 2

COV(X,Y) = 1/2
RV(X,Y) = (1/2)/sqrt(2/8)=(1/2)/sqrt(1/4)=1

Cet exemple est amusant car on trouve sur la même droite les deux opérateurs d'Escoufier et leur compromis. On voit d'ailleurs que même sur des exemples simplissimes le calcul n'est pas simple. Notons A la matrice XtX soit
1 0 -1 0
0 1 0 -1
-1 0 1 0
0 -1 0 1
l'opérateur WD du triplet (X, 1/2*Id2, 1/4*Id4) vaut
W1D = A/8
l'opérateur WD du triplet (Y, 1/2*Id2, 1/4*Id4) vaut
W2D = A/2 (il est 4 fois plus grand car les points sont deux fois plus loin)
A*A a pour trace 8
tr(W1D*W1D) = tr(A*A)/16 = 1/8
tr(W2D*W2D) = tr(A*A)/4 = 2
tr(W1D*W2D) = tr(A*A)/16 = 1

La matrice des RV vaut
1 1
1 1
Elle a (1, 1) comme vecteur propre pour lambda = 2 et (1, -1) pour lambda = 0
Le premier vecteur propre normé vaut (1/sqrt(2), 1/sqrt(2)) et le compromis est
(1/sqrt(2))W1D+(1/sqrt(2))W2D = (1/sqrt(2))(1/2+1/8)A
Il a 2 valeurs propres non nulles égales à 5/(4*sqrt(2)) = 0.8839
C'est la version du programme STATIS: Operator averaging
Dans l'option Canonical: RV coefficients on prend les opérateurs normés et le compromis est (1/sqrt(2))W1D/||W1D||+(1/sqrt(2))W2D/||W2D|| soit
(1/sqrt(2))(A/8)/sqrt(1/8)+(1/sqrt(2))(A/2)/sqrt(2) soit
A/4 + A/4 = A/2 qui a deux valeurs propres non nulles égales à 1.

Pour les variables quantitatives il vaut mieux prendre le module Canonical et comparer avec les autres options mais pour les tableaux d'AFC il vaut mieux prendre STATIS.

Une question : quelqu'un se sert-il de STATIS ?
Cordialement

>j'ai voulu faire un petit test pour illustrer la difference entre la
>covariance vectorielle et le coefficient Rv. J'ai pris deux configurations
>homothétiques de 4 points.
>
>A(1,0), B(0,1), C(-1,0), D(0,-1)
>A(2,0), B(0,2), C(-2,0), D(0,-2)
>
>L'execution du module operator averaging, option COVV, renvoie la matrice
>d'operateurs suivante :
>0,125
>0,5 2
>
>L'execution du module operator averaging, option RV, renvoie la matrice
>d'operateurs suivante :
>1
>1 1
>
>ce qui ne correspond pas a ce que j'attendais d'après le calcul sur la
>matrice des VAV-COVV :
>1
>0,71 1
>
>Me suis-je trompé ? S'agit-il d'un bug numerique du au choix de mon exemple
>ou s'agit d'un oubli de racine carrée ?
>
>A bientot

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:35:54 MET