Re: double centrage-reduction

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Mon Jun 29 1998 - 12:58:09 MET DST


Pour répondre à la question de Romain JOCTEUR MONROZIER, on peut rappeler
les éléments suivants.

1) On peut faire toute transformation préalable d'un tableau
X = [xij] --> Y = [yij]
puis faire l'analyse du triplet (Y, D, Q) avec deux pondérations lignes et
colonnes arbitraires par PCA: Non centred PCA.

2) Les transformations classiques sont
yij = xij - x_j (x_j moyenne sur i des xij) (PCA: Covariance matrix PCA)
yij = (xij - x_j)/etj (etj ecart-type sur i des xij) (PCA: Correlation
matrix PCA). Seule cette version manipule effectivement la corrélation
entre variables et définit la carte des variables dans un cercle (cercle
des corrélations).

3) On trouve les transformations
yij = xij - x__ (centrage unique : Overall centring)
yij = xij - xi_ (centrage par ligne : Row centring)
yij = xij - x_j (centrage par colonne : Column centring)
yij = xij - xi_ - x_j + x__ (double centrage additif : Double centring additive)
yij = xij - aibj (double centrage multiplicatif : Double centring
multiplicative)
dans le module HTA pour tableaux homogènes
La signification des corrélations entre variables est perdu dans tous les cas.

4) Quand on veut que deux individus du type
a = xi1, ..., xij, ..., xip
b = xi1+h, ..., xij+h, ..., xip+h
soient repérés comme identiques on doit faire un double centrage additif.
On a alors une ACP sur matrice de covariances standard qui s'interprète en
terme de covariances plutôt que de corrélations mais c'est assez voisin.

4) Quand on veut que deux individus du type
a = xi1, ..., xij, ..., xip
b = xi1*h, ..., xij*h, ..., xip*h
soient repérés comme identiques on doit faire un double centrage additif
sur les log(xij). On a alors une ACP sur matrice de covariances standard
qui s'interprète en terme de covariances plutôt que de corrélations mais
c'est assez voisin. C'est la standard d'élimination de l'effet taille en
morphométrie (voir Yoccoz, N. G. (1993) Morphométrie et analyses
multidimensionelles. Une revue des méthodes séparant taille et forme. In :
Biométrie et Environment. Lebreton, J.D. & Asselain, B. (Eds.) Masson,
Paris. 73-99)

5) Si on a une idée précise d'un mécanisme qui donne une forme spéciale aux
données et qu'on est dans la possibilité de construire un tableau modèle
mij on peut analyser par PCA: Decentring X[i,j] - Model[i,j] les écarts du
tableau de données aux tableau modèle. On a plus de notion de covariance
mais on doit se baser sur la reconstitution en pensant qu'on cherche à
reconstruire les données sous la forme xij = mij + a1*L1j*cij + a2*L2i*c2j
+ ... (biplot voir Gabriel dans la biblio).

6) Si on a deux tableaux d'observations identiques (avant-après) avec des
variables d'unité différentes on peut normaliser par colonnes les
différences (PCA: Normed Y[i,j] - X[i,j]). On a une carte des variables
dans un cercle qui n'est plus de corrélation et le nuage des individus
n'est pas forcément centré.

Ceci permet à un utilisateur averti de construire sa propre analyse en
fonction des contraintes qu'il est seul à connaître. Il faut faire soi-même
une étude de la situation.

à suivre ...

>Je travaille sur un tableau decrivant p produits alimentaires par d
>variables.
>Une ACP (sur matrice de correlation) de ce tableau est possible, mais on
>aboutit tres souvent a un effet taille. Celui-ci est du a des differences
>d'intensite globale entre produits : si deux produits sont lies des fa+AOc-on
>suivantes P1+AD0-P2+ACo-k ou P1+AD0-P2+-k. Pour focaliser l'analyse sur
>des difference de
>forme et non de niveau, je cherche a retirer des donnees ces differences.
>Pour l'instant, je centre egalement les notes par produit.
>Dans ce cas la, le sens des correlations entre variables est il toujours
>conserve ?
>Si je reduis les notes par produit, je casse les relations entre variables.
>Deux variables dependantes de facon additive ou multiplicative ne seront
>plus confondues, ce qui est genant.
>
>Comment contourner ce probleme ?
>
>Merci d'avance
>
>Romain JOCTEUR MONROZIER
>TEPRAL
>c/o Brasseries Kronenbourg
>68, route d'Oberhausbegen
>67037 Strasbourg Cedex
>03-88-27-40-28
>03-88-27-48-79 (fax)
>rmonrozier+AEA-tepral.fr

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:58 MET