Bonjour,
Roche Philip écrit :
>Il me semble avoir compris que le coefficient RV en analyse de
>Co-inertie traduisait d'une façon globale l'adéquation des deux
>tableaux, un peu à la façon du rapport des traces (trace ACC/trace AFC
>initiale) en ACC.
>
>Quelqu'un peut-il me confirmer ou me contredire ?
On peut confirmer en première approche et souligner les différences de fond pour continuer. C'est un indice d'adéquation entre les deux tableaux mais de logique et de signification tout à fait différente.
Le coefficient RV est est une mesure d'adéquation de structure.
Prenons une ACP centrée. La trace de cette analyse est égale à la somme des variances des variables, donc à la somme des valeurs propres. Une trace élevée veut dire une variabilité élevée. C'est un indice de variabilité mais pas un indice de structure. Deux analyses peuvent donner la même trace mais l'une avec des valeurs propres du type
******************
**************
***********
*******
***
*
et l'autre avec des valeurs propres du type
*****************************
*******************
**
**
*
*
La trace est la même (il y a le même nombre d'étoiles copier-coller !)
La structure du second est bien plus forte que la structure du premier.
Quel indice mesure cette différence : tout écologiste dira la somme des carrés des valeurs propres (un indice de diversité !).
La somme des carrés des valeurs propres est ce que Y. Escoufier a appelé la variance vectorielle.
Elle croit avec la variabilité et avec la structure.
Quand il y a deux tableaux appariés par les lignes, il y a deux triplets
(X1, M1, D) et (X, M2, D)
et le triplet de la costructure (X2tDX1, M1, M2).
Il y a donc 3 indices de variabilité et 3 indices de structures :
la trace de l'analyse 1 Tr(X1tDX1M1) = Somme des vp1 (valeurs propres du tableau 1) = Iner1 (inertie totale du tableau 1)
la variance vectorielle 1 = Tr (X1tDX1M1X1tDX1M1) = Somme des carrés des vp1 = VAV1 (Variance vectorielle du tableau 1) = Tr (X1M1X1tDX1M1X1tD)
la trace de l'analyse 2 Tr(X2tDX2M2) = Somme des vp2 (valeurs propres du tableau 2) = Iner2 (inertie totale du tableau 2)
la variance vectorielle 2 = Tr (X2tDX2M2X2tDX2M2) = Somme des carrés des vp2 = VAV2 (Variance vectorielle du tableau 2) = Tr (X2M2X2tDX2M2X2tD)
la trace de l'analyse de coinertie = Somme des valeurs propres de l'analyse du tableau croisé = Tr (X2tDX1M1X1tDX2M2) = Tr (X2M2X2tDX1M1X1tD) = Somme des valeurs propres de la co-inertie = Somme des covariances au carrés des coordonnées factorielles de coinertie.
On s'arrête au cinquième car il se passe quelquechose de peu banal
Si A1 = X1M1X1tD, A2 = X2M2X2tD
alors la variance vectorielle de X1 est Tr(A1A1), la variance vectorielle de X2 est Tr(A2A2) et ce que Escoufier a appelé la covarariance vectorielle est
Tr(A1A2). Donc comme A1 et A2 sont des endomorphismes D-symétriques (question de matheux ! ce n'est pas grave) Tr(A1A2) est un produit scalaire et
Tr(A1A2)/sqrt (Tr(A1A1)Tr(A2A2)) est une corrélation entre tableaux qui s'écrit
Somme des vp co-inertie/sqrt((somme des vp1*vp1)*(somme des vp2*vp2))
Cet indice grandit avec la structure de co-inertie ramenée aux structures d'inertie.
Les traces des analyses sont des indices de variabilité mais les VAV et les RV sont des indices de structures et de co-structure.
Pourquoi trouve-t'on le RV dans le programme de co-inertie. C'est la première fois qu'on me pose la question. J'étais étonné qu'il traîne un indice dans le programme dont personne se demandait à quoi il pouvait servir.
Pour des raisons d'unité du total. La co-inertie est totalement apparentée aux analyses d'inertie et donc on passe d'une variance de coordonnée à une covariance de coordonnée, d'une inertie à une co-inertie, d'une répartition de l'inertie entre valeurs propres à une répartition de co-inertie entre valeurs propres. Le test de permutation porte sur la co-inertie totale. C'est simple.
Mais c'est aussi le premier pas vers la suite. Et si on manipule 3, 4, ..., K tableaux, qu'est-ce qui va faire le joint : la matrice des coefficients RV qui est la base de STATIS. Donc j'ai mis un relai, une indication qu'avec deux tableaux on a deja la notion RV et qu'avec K tableaux on aura K(K-1) coefficients RV. Avec 2 tableaux on a un RV et comme de coutume, quand on a une valeur elle n'a guère de signification. Mais avec K tableaux on comparera des RV (toute signification dérive d'une différence, comme disent les structuralistes) et on dira celui-ci ressemble plus à celui-là ...
Le RV du programme de co-inertie est le point d'entrée dans la logique des K tableaux
Merci de cette question qui n'était pas anodine
Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:28 MET