Analyses spatiales (Re : Konstantinos Ghertsos)

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sun May 17 1998 - 17:28:24 MET DST


Une question de Konstantinos Ghertsos est restée sans réponse et peut
concerner ceux qui utilise les analyses sous contraintes spatiales.

Prenons un exemple.

Mettre les fichiers des cartes Jons, Jons+1 et Jons+2 dans un dossier de travail
Vérifier avec Areas: Area Edit sur Jons.area qu'on a bien la figure des
unités d'échantillonnage
Créer un fond de carte et des coordonnées avec Areas: AreasToBkgnd sur Jons.area
Créer un graphe de voisinage avec Areas: AreasToGraph sur Jons.area
C'est la manière la plus rapide d'obtenir un exemple du nécessaire à cette
analyse

Le graphe de voisinage définit des poids des individus qui sont dans Jons_G.gpl
  0.0045
  0.0113
  0.0113
  0.0113
...
Un point a un poids proportionnel à son nombre de voisins

Faire l'AFC du tableau faunistique Avi_Jons avec cette pondération
(COA: Row weighted COA)
Data file : Avi_Jons
Row weight : Jons_G.gpl
Generic output file : AA

Les valeurs propres sont
  0.5131
  0.4739
  0.3750
  0.2567
...

Pour faire la même AFC sous contrainte spatiale utiliser NGStat: Moran
Index Analysis

input file : AA.fcta
Graph input file : Jons_G.gpl

On obtient

Moran Index linear analysis
Access to neighbouring relationship: Jons_G.gpl
Preliminary analysis: AA.fcta
--------------------------------------------
Trace = 5.211e+01

File AA_MA.xmcs contains spatial covariances
--- It has 64 rows and 64 columns

Num Eigenval.|Num. Eigenval.|Num. Eigenval.|Num. Eigenval.|
001 1.746e-01|002 1.200e-01|003 9.014e-02|004 7.691e-02|
005 6.505e-02|006 5.651e-02|007 4.609e-02|008 4.312e-02|
...

File AA_MA.xmvp contains the eigenvalues
--- It has 64 rows and 1 column

File AA_MA.xmw1 contains weights of columns for row scores
--- It has 64 rows and 2 columns
File :AA_MA.xmw1
|Col.| Mini | Maxi |
|----|----------|----------|
| 1|-7.020e+00| 3.161e+00|
| 2|-2.942e+00| 5.585e+00|
|----|----------|----------|

File AA_MA.xmli contains row scores (linear combination having maximal
Moran Index)
--- It has 91 rows and 2 columns
File :AA_MA.xmli
|Col.| Mini | Maxi |
|----|----------|----------|
| 1|-2.818e+00| 8.650e-01|
| 2|-1.785e+00| 2.763e+00|
|----|----------|----------|

Axis: 1 Spatial correlation: 5.223e-01
Axis: 2 Spatial correlation: 3.803e-01

La question Konstantinos Ghertsos concerne AA_MA.xmw1. La doc n'est pas
claire sur ce point.
Comme tous les modules d'ADE-4 ce programme admet en entrée une analyse
simple quelconque, ici une analyse des correspondances. Ce pourrait être
une ACP, une ACM, ...
L'analyse simple porte sur le triplet statistique (X, Dp, Dn). X est la
tableau transformé, Dp la diagonale des poids des colonnes (espèces) Dn la
diagonale des poids des lignes.
L'analyse sous contrainte est du type (X, Dp, Qn) avec le même tableau, le
même poids des colonnes et une métrique plus complexe sur les individus qui
dérive du graphe de voisinage et qui va permettre de créer des coordonnées
covariantes le plus possible entre voisins.

Quand on fait l'AFC simple on cherche un vecteur u de Rp tel que ||XDpu||2
soit maximum au sens de Dn. Dans l'analyse sous contrainte on cherche un
vecteur u tel que ||XDpu||2 soit maximum au sens de Qn.

Quand on est en ACP les vecteurs u sont les poids des variables qui
permettent de calculer les coordonnées (loadings) et dans la vision
géométrique les axes principaux. Quand on est en AFC, c'est un peu plus
compliqué. Pour comprendre faire deux passages dans MatAlg: Diagonal Inner
product C=X'DY

1) Input file for X matrix : AA_MA.xmw1
Option for X matrix : default=none
Input file for Y matrix : rien
Option for Y matrix : default=none
D inner product : 2 (choix dans un fichier)
Option: weight file : AA_fcpc

Observer que le résultat est le vecteur nul. (les moyennes des colonnes de
AA_MA.xmw1 pour les poids de AA_fcpc sont nulles)

1) Input file for X matrix : AA_MA.xmw1
Option for X matrix : default=none
Input file for Y matrix : AA_MA.xmw1
Option for Y matrix : default=none
D inner product : 2 (choix dans un fichier)
Option: weight file : AA_fcpc

Observer que le résultat est la matrice identité. (les variances des
colonnes de AA_MA.xmw1 pour les poids de AA_fcpc sont unitaires et les
covariances nulles)

Donc dans ce fichier on trouve des scores numériques des espèces de
moyennes nulles, de variance unité et de covariances nulles. Ce sont des
coordonnées des espèces de variances 1.
On peut vérifier que dans AA_MA.xmli que les coordonnées des relevés sont
obtenues par moyenne des scores des espèces qu'on y trouve.

Donc cette analyse place les espèces avec des scores normés, les sites à la
moyenne des espèces qui sont dedans et le tout est d'autocovariance
spatiale maximum. C'est une demi AFC de type relevés à la moyenne des
espèces sous contrainte de cartographiabilité.

Pourquoi demi ? Dans l'AFC on fait 1) espèces avec des scores normés, 2)
sites à la moyenne des espèces qui sont dedans et le tout est de variance
maximale mais aussi 3) sites avec des scores normés, 4) espèces à la
moyenne des sites où elles sont et le tout est de variance maximale. Comme
on introduit la contrainte spatiale on ne peut pas tout avoir.

IMPORTANT : Pour chaque analyse de base, il faut refaire ce raisonnement.
Si on fait une ACP normée sous contrainte spatiale le fichier _MA.xmw1
contient des scores des variables (a1, a2, ..., ap) de somme de carrés = 1
qui permettent de calculer une combinaison linéaire des variables de départ
a1*x1 +...+ ap*xp comme dans l'ACP normée de départ. Mais dans l'ACP normée
le résultat sera de variance maximum et dans l'ACP spatiale le résultat
sera de covariance spatiale maximum. On peut même définir des analyses de
co-inertie sous contrainte spatiale (confidentiel dans Chessel, D. &
Sabatier, R. (1993) Couplage de triplets statistiques et graphes de
voisinage. In : Biométrie et Données spatio-temporelles. Asselain, B. &
Coll. (Ed.) Société Française de Biométrie, ENSA, Rennes. 28-37) qui était
dans la version 3.7 mais qui n'ont pas été réimplantées.

Pour les fichiers _xgw1, c'est exactement la même chose mais les scores des
relevés sont alors de variance locale maximale. C'est nettement moins
souvent utile.

C'est vrai que la documentation est loin d'être limpide sur cette question.
merci à Konstantinos Ghertsos.

> Je tiens d'abord a vous filiciter pour le logiciel ADE 4 (version
>PC) ga permet avant tout de mieux valoriser mon travail en ecologie
>marine grbce ` toute la panoplie de tests contenus. Je suis itudiant
>grec en DEA poursuivant mon mimoire ` la Station Marine de Wimereux,
>intituli structure du macrozoobenthos en Manche, approches Locales et
>Globales ou je traite plusieurs tableaux esphces-stations d'annies
>consecutives. Votre module contenant les Analyses de Geary et Moran
>(suite d'une AFC ponderie par un graphe de voisinage) ma permis de
>endeduire des informations assez interessantes. Je serais trhs
>reconnaissant si vous pourriez me donner plus de details sur le calcul
>du fichier .xmw1 "weights of columns for row scores" (Moran et Geary
>Index Analysis)
>pour que je puisse comprendre mieux exactement la signification par
>rapport ` une AFC
>classique. Je pose cette question car j'ai identifii des petits 'patch'
>locales en face de l'estuaire de la Seine et je cherche donc `
>identifier les esphces responsables ou plus, auriez vous de plus
>quelques
>suggestions autres que le fichiers des poids de variables .xgw1? Je vois
>
>qu'il y a beaucoup d'options sur l'analyse du graphe de voisinage lui
>mjme mais j 'ai des difficultis ` me dibrouiller avec le frangais dans
>la documentation, pour trouver des options plus liies aux esphces eux
>mjmes (aprhs ponderation....). Je vous serais trhs reconnaissant si vous
>
>pouviez m'aider.
>Je vous prie d'accepter mes sentiments les plus respectueux
>
>Konstantinos Ghertsos

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:57 MET