Calcul de distances euclidiennes

From: RAMI Jean-Francois (rami@cirad.fr)
Date: Thu Mar 12 1998 - 08:46:34 MET


Bonjour,

J'utilise la fonction "compute distance" du module "clusters" pour estimer
une distance euclidienne. J'ai constaté dans les résultats une distance
égale à 1 entre deux observations ayant des valeurs égales pour plus d'une
variable. En outre lorsque je fait la manip avec Systat (SPSS) je n'obtient
pas du tout les mêmes valeurs.
En quoi les fonctions du module cluster différent elles du calcul de
distance euclidienne de systat?
Voici pour appuyer mon propos les 6 premieres observations de mon fichier
(203 variables), les ditances calculées par le module cluster puis celles
obtenues par systat:

****************** 6 rows/203col**************
0.11494 0.88506 0 0 1 0 0.65823 0.35443 1 0 0 0 1 0 0 0 1 0 0 0 0 1 0 1 0 1
0 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 0 1 0 0
0 0 0 1 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1
0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 0
0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 0 1 0 1 0 1 0 0 1 0 0 1 0
0 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1
0 1 0 1 0 0 0.65823 0.35443 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 1 0 1 0
0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0
0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 1
0 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1
0 0 1 0 1 0 0 1 0 0 1 0 1 0 0 0 0 0 1 1 0 0 1 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0
0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1
1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0.12766 0.80851 0.06383 0 1 0 1
0 0 0 0 1 1 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 1 1 0 0 1 0 0 0 0 0
0 1 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0
1 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0
0 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 1 1 0 0 0 1 0
0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 1
0.11494 0.88506 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0
0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0
0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 0
0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1
0 0 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0
0 1 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1
0 1 0 0 1 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0
0 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0
1 0 1 0 0 0 0 0 1 0 1 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1
0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0
1 0 1 0 0 1 1 0 0 0 0 1 0 1 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 0 1 0 1 0 0
1 0 0 0 0 0 0 1 1 0 0 0 1
0 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1 0
0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 1 0
1 0 0 0 1 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0
1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 1
0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0 0 1 1 0 0 0
0 0 1 0 0 0 0 1 1 0 0 1 0

******distances obtenues par cluster **** 6 rows/ 6 col****************
0 0.75177 0.85861 0.72391 0.80913 0.79559
0.75177 0 0.88621 0.78182 0.83538 0.87352
0.85861 0.88621 0 0.89429 0.82105 1
0.72391 0.78182 0.89429 0 0.72229 0.78013
0.80913 0.83538 0.82105 0.72229 0 0.87201
0.79559 0.87352 1 0.78013 0.87201 0

******distances obtenues par systat **** 6 rows/ 6 col****************
   .000 . . . . .
  .506 .000 . . . .
  .578 .597 .000 . . .
  .487 .526 .602 .000 . .
  .545 .563 .553 .486 .000 .
  .536 .588 .673 .525 .587 .000

N'hésitez pas à me faire remarquer toute incohérence dans mes propos !
Merci.



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:52 MET