Re: ACP sur graphe de voisinage

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sat Jul 17 1999 - 09:43:55 MET DST


At 16:23 14/07/99 +0200, you wrote:
Bonjour,

Les questions posées par Alain Bellido sont d'intérêt général.

>1) Suivant la doc 'Autocorrelation spatiale', j'ai calcule les operateurs
de Moran sur la matrice binaire correspondant au graphe de Gabriel. Surprise
: les deux premieres valeurs propres sont egales a 1, ce qui donne des
scores representes par 2 valeurs differentes seulement (pas tellement
pertinent).

La diagonalisation de l'opérateur de Moran ne fait que rendre compte de la
structure du graphe de voisinage. Pour comprendre le résultat, il suffit de
connaître la propriété de ces vecteurs propres. Ce sont des scores
numériques sur les n observation. Comme toutes variables ces scores ont une
moyenne, une variance, ... Ils ont surtout une corrélation spatiale
(corrélation sur les couples de voisins). Cette corrélation ne peut dépasser
1, mais elle peut l'atteindre pour les graphes non connexes. Par exemple si
1 est voisin de 2 et si 1 et 2 n'ont pas d'autres voisins, un score qui
prend une valeur pour 1 et 2 et une autre valeur pour tous les autres a une
variance de voisinage nulle (deux points voisins ont la même valeur) et une
corrélation spatiale de 1 (deux points voisins ont la même valeur). C'est
par exemple vrai pour le graphe "deux points sont voisins s'ils sont dans le
même groupe et ne le sont pas sinon".

Le graphe utilisé a simplement défini des groupes de voisins isolés des
autres et le résultat n'a rien de surprenant. Un vecteur propre de voisinage
est toujours pertinent en ce sens qu'il participe à la transformation du
graphe en paquets de variables. Ce qui ne l'est pas forcément, c'est le
graphe lui-même.
Le plus simple est de visualiser le graphe avant de s'en servir.

>Comment peut-on interpreter ces resultats ? Serait-ce du au critere de
voisinage (Gabriel) utilise (deux points sont connectes si aucun autre point
ne se trouve a l'interieur du cercle de diametre defini par ces 2 points) ?
La réponse est donc oui.

>2) Dans l'article de Thioulouse et al : "Multivariate analysis of spatial
patterns: a
>unified approach to local and global structures.", il est suggere de
projeter les variables a expliquer sur les derniers facteurs de l'operateur
de Moran lorqu'on veut eliminer la structure spatiale de nos donnees
(equivalent de la regression polynomiale chez Borcard et Legendre).
>"The problem of modelling the non spatially structured fractions (Borcard
and Legendre, 1994 p. 60) can also be tackled by using the last (instead of
the first) eigenvectors of the smoothing operators. Indeed, these
eigenvectors are "anti-smooth" and thus provide a good way to model local
structures."
>Quelles regles de choix adopter (combien de facteurs retenir p.ex) ? Y a
t-il des articles ayant formalise cette methode, par exemple pour une
utilisation avec des variables instrumentales (certaines choses etaient
annoncees "en preparation" dans l'article ci-dessus) ?

C'est une question assez difficile qui touche au fait que ce qui n'est pas
cartographiable n'est pas forcément local. Minimiser la variance entre
voisin ou maximiser la corrélation entre voisins c'est rendre compte de ce
qui est cartographiable ou lisse pour un processus temporel. Maximiser la
variance entre voisins c'est rendre compte de ce qui est anti-lisse. Ces
notions ne sont pas très claires. Il y a un exemple extrêmement convaincant
dans Meot, A., Chessel, D. & Sabatier, R. (1993) Opérateurs de voisinage et
analyse des données spatio-temporelles. In : Biométrie et Environnement.
Lebreton, J.D. & Asselain, B. (Eds.) Masson, Paris. 45-72. On y modélise la
croissance de la production d'un arbre en fruits par les vecteurs lisses et
l'alternance (années bonnes et mauvaises) par des vecteurs anti-lisses, le
résidu étant corrélé entre arbres par le biais de la météo. Cet exemple
reste un cas d'école.
L'article de Méot, A., Legendre, P. & Borcard, D. (1998) Partialling out the
spatial component of ecological variation: questions and propositions in the
linear modelling framework. Environmental and Ecological Statistics : 5, 1-27.
fortement inspiré de la doc de Projectors reprend ce problème mais
uniquement avec des polynomes des coordonnées et ne simplifie pas la
question. Les vecteurs propres de voisinages sont intéressants en ce sens
qu'ils forment une base orthonormée de l'espace entier qui garantit des
régressions sur des sous-ensembles très stables, mais le choix des
sous-espaces nécessiterait qu'un statisticien inférentiel donne des
indications sur le sujet.

>2) Je cherche un utilitaire qui fournisse les couples de points connectes
suivant la triangulation de Delaunay, a partir de leurs coordonnees x,y. (il
y a plein de choses sur les graphes de Delaunay sur le Net mais pas
exactement cela). Je sais que R package pour Mac fait cela (ainsi que
d'autres utilitaires cites dans ADE) mais je cherche l'equivalent pour PC.

J'aimerais bien répondre positivement, mais ce n'est pas simple. Les outils
très graphiques ont tous été développé sur le mac et le transfert se fait
lentement.

Le génial Groups&Graphs de Bill Kocay a maintenant une version Windows
http://bkocay.cs.umanitoba.ca/G&G/G&G.html

This is the first release of G&G for Windows.
It requires Windows95 or 98 or NT.
It currently contains about 75% of the functionality of the Mac version.
More functionality will be added in the coming months.
Il manque encore la lecture-écriture en ASCII qui permettrait l'interface
avec ADE-4 comme sur Mac.

Les auteurs de Cabri-Graph
http://www-cabri.imag.fr/CabriGraphes/cabri_graph.html
ne font pas référence à une version Windows

l'extraordinaire XYZ: EXperimental GeometrY Zurich n'a pas de version Windows.

On peut voir QHull
Les sources en C sont disponibles
http://www.geom.umn.edu/~bradb/qhull.html
à suivre...
Daniel Chessel
---------------------------------
Universite Lyon 1 - Bat 401C
69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77
Fax : 04 72 43 11 41
---------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:00 MET