Re: analyses de contiguité

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sat Jan 27 2001 - 09:57:16 MET


La question de Marion VERDOIT permet d'attirer l'attention sur un fait
important.

Toutes les analyses implantées dans ADE-4 sont du type (X,Q,D)
X est un tableau à n lignes et p colonnes
Q est une matrice à p lignes et p colonnes
D est une matrice à n lignes et n colonnes
On peut croire en partant de cette homogénéité que ce sont toutes des
analyses d'inertie
Il n'en est rien.

On peut distinguer 5 cas
1) Q et D sont des matrices diagonales à termes positifs
C'est le cas le plus répandu.
        X est dans -.**ta
        Q est dans -.**pc (un vecteur suffit pour garder la diagonale le reste
étant nul)
        D est dans -.**pl (idem)
Q sert de pondération dans Rn (elle donne les poids des p colonnes) et de
métrique dans Rp
D sert de pondération dans Rp (elle donne les poids des n lignes) et de
métrique dans Rn
Pour faire une analyse d'inertie, il faut
        une métrique (gémétrie euclidienne)
        une pondération (calcul de base = poids*carré de distance)
Les analyses du cas 1 sont des DOUBLES analyses d'inertie (ACP, AFC, ...)
L'analyse de co-inertie est ainsi une analyse d'inertie double pour les
variables de chaque tableau.
Une analyse inter-classe est ainsi une double analyse d'inertie pour les
variables et les classes.
Noter qu'une analyse d'inetie peut être possible et n'avoir que très peu
d'intérêt (ACM).

2) D est une matrice diagonale à termes positifs (poids)
Q est une matrice non diagonale mais symétrique et positive
Q sert de métrique dans Rp et D sert de pondération dans Rp
On a alors une analyse d'inertie SIMPLE sur le nuage des lignes
Cas typiques : analyse discriminante, ACPVI, CCA

3) Q est une matrice diagonale à termes positifs (poids)
D est une matrice non diagonale mais symétrique et positive
D sert de métrique dans Rn, et Q sert de pondération dans Rn
On a alors une analyse d'inertie SIMPLE sur le nuage des colonnes
Cas typiques : l'analyse locale (NGStat: Geary Index Analysis)

4) Q est une matrice non diagonale mais symétrique et positive
D est une matrice non diagonale mais symétrique et positive
On a alors AUCUNE analyse d'inertie parce qu'on pas de poids
Cas typique : l'analyse canonique avec ses deux normes de Mahalanobis non
diagonales

5) Des cas originaux. Exemple :
Q est une matrice diagonale à termes positifs (poids)
D est une matrice non diagonale mais symétrique et NON POSITIVE
On n'a pas d'analyse d'inertie d'un côté parce que on n'a pas de poids
On n'a pas d'analyse d'inertie de l'autre côté parce qu'on n'a pas de norme
C'est le cas de l'analyse spatiale (NGStat: Moran Index Analysis)

L'inertie totale de l'analyse simple est la somme d'une inertie locale
(entre voisins) et d'une quantité qui n'est pas une inertie car elle a une
composante négative (la corrélation négative entre voisins)
D'où la question de Marion VERDOIT
Il n'y a pas de comparaison possible et ce n'est pas un bug.
En gros, pour le spatial on ne peut pas rééditer le coups des analyses inter
inertie totale = inertie INTRA + inertie INTER
On peut faire
inertie totale = inertie locale (entre voisins) + inertie entre non voisins

On utilise la globale comme une analyse canonique
Chacune des variables a un coefficient de corrélation spatiale
on peut faire des cartes
On peut compléter en combinant les variables pour faire les meilleurs
cartes de synthèse
et comparer les cartes par variables aux cartes individuelles (Thema73 p. 21)

Plus généralement quand ADE-4 ne donne pas de statistiques d'inertie c'est
qu'il n'y en a pas.
Si on a des fichiers -.**ta (tableaux) -.**pl -.**pc (poids) -.**li -.**co
(coordonnées) et -.**vp (valeurs propres)
on peut avoir les statistiques d'inertie complète (DDUtil: Rows: Inertia
analysis et DDUtil: Columns: inertia analysis)
Pour éviter des calculs abusifs les analyses qui n'autorisent pas cet
emploi on des noms différents
(par exemple .xmw1 pour les poids des colonnes mais pas de .xmco pour les
coordonnées des colonnes)
A noter dans Thioulouse, J., Chessel, D. & Champely, S. (1995) Multivariate
analysis of spatial patterns: a unified approach to local and global
structures. Environmental and Ecological Statistics : 2, 1-14 la faute de
frappe en bas de la page 3.
Lire LV(x)=(1/2)SiSjpij(xi-xj)^2 (il manque le 1/2 lamentable)

Pour les amateurs, on pourrait faire une une antidiscriminante locale avec
(X, (XtDX)-, P)
On aurait des combinaisons de variables de variance 1 et de corrélation
spatiale maximale !
Ce cas aurait une norme non diagonale et une matrice qui n'est pas une norme.

Cordialement

At 09:43 26/01/01 +0100, Marion VERDOIT wrote:
>Bonjour à tous les utilisateur d'ADE,
>
>J'ai implémenté sur mes données les analyses de contiguité avec le
>logiciel ADE-4 (modules NGUtil et NGStat). J'ai remarqué sur les sorties
>des resultats, que pour l'analyse globale on n'a pas en sortie le
>pourcentage d'inertie expliqué par chaque axe factoriel, mais on a à la
>place le coefficient de correlation spatial, ainsi que les valeurs
>propres associées.
>Je souhaiterais savoir comment on doit interpreter ce coefficient, et
>comment on peut le comparer au pourcentages d'inertie issus des
>analyses tocales et locales?
>
>Je vous remercie de votre réponse
>
>Cordialement
>
>Marion Verdoit
>
>--
>Marion Verdoit
>Doctorante, Laboratoire MAERHA
>IFREMER BP 21105
>44311 Nantes Cedex 03
>FRANCE
>
>E-mail : mverdoit@ifremer.fr
>Tel : 02 40 37 41 64
>Fax : 02 40 37 40 75

Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77 - (33) 4 72 44 82 77



This archive was generated by hypermail 2b30 : Thu Jul 04 2002 - 09:39:09 MEST