Well,
here is the difensor of JT&DC's work [?]....
The 'problem', I think, is that Cluster computes distances and then scales
them with respect to the maximium one. Looking at you data, the maximum
distance (systat) occurs between obs 1 & 6 (0.673): from Cluster it comes
with the value of 1...
Well, I hope to be right...
----------------------------------------
Federico Spinazzi
email: federico@syspr03.disat.unimi.it
----------------------------------------
On Thu, 12 Mar 1998, RAMI Jean-Francois wrote:
> Bonjour,
>
>
> J'utilise la fonction "compute distance" du module "clusters" pour estimer
> une distance euclidienne. J'ai constaté dans les résultats une distance
> égale à 1 entre deux observations ayant des valeurs égales pour plus d'une
> variable. En outre lorsque je fait la manip avec Systat (SPSS) je n'obtient
> pas du tout les mêmes valeurs.
> En quoi les fonctions du module cluster différent elles du calcul de
> distance euclidienne de systat?
> Voici pour appuyer mon propos les 6 premieres observations de mon fichier
> (203 variables), les ditances calculées par le module cluster puis celles
> obtenues par systat:
>
> ****************** 6 rows/203col**************
> 0.11494 0.88506 0 0 1 0 0.65823 0.35443 1 0 0 0 1 0 0 0 1 0 0 0 0 1 0 1 0 1
> 0 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 0 1 0 0
> 0 0 0 1 0 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1
> 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 0
> 0 1 0 0 1 0 0 0 1 0 1 0 0 0 1 1 0 0 1 0 0 0 0 1 0 0 1 0 1 0 1 0 0 1 0 0 1 0
> 0 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1
> 0 1 0 1 0 0 0.65823 0.35443 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 1 0 1 0
> 0 0 0 1 1 0 0 0 1 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0
> 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 1
> 0 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1
> 0 0 1 0 1 0 0 1 0 0 1 0 1 0 0 0 0 0 1 1 0 0 1 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0
> 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 1
> 1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0.12766 0.80851 0.06383 0 1 0 1
> 0 0 0 0 1 1 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 1 1 0 0 1 0 0 0 0 0
> 0 1 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 1 1 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0
> 1 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 1 0 0 0 0
> 0 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 1 1 0 0 0 1 0
> 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 1
> 0.11494 0.88506 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0
> 0 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0 1 0 0 0 1 0 0 0 0 1 0 0
> 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 0
> 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1
> 0 0 1 0 1 0 0 0 1 0 1 0 1 0 0 0 0 0 1 1 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0
> 0 1 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1
> 0 1 0 0 1 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0
> 0 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0
> 1 0 1 0 0 0 0 0 1 0 1 1 0 1 0 0 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 1
> 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0
> 1 0 1 0 0 1 1 0 0 0 0 1 0 1 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 0 1 0 0 1 0 1 0 0
> 1 0 0 0 0 0 0 1 1 0 0 0 1
> 0 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1 0
> 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 1 0
> 1 0 0 0 1 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0
> 1 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 1
> 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 1 0 0 0 1 0 1 0 0 0 1 1 0 0 0
> 0 0 1 0 0 0 0 1 1 0 0 1 0
>
>
> ******distances obtenues par cluster **** 6 rows/ 6 col****************
> 0 0.75177 0.85861 0.72391 0.80913 0.79559
> 0.75177 0 0.88621 0.78182 0.83538 0.87352
> 0.85861 0.88621 0 0.89429 0.82105 1
> 0.72391 0.78182 0.89429 0 0.72229 0.78013
> 0.80913 0.83538 0.82105 0.72229 0 0.87201
> 0.79559 0.87352 1 0.78013 0.87201 0
>
>
> ******distances obtenues par systat **** 6 rows/ 6 col****************
> .000 . . . . .
> .506 .000 . . . .
> .578 .597 .000 . . .
> .487 .526 .602 .000 . .
> .545 .563 .553 .486 .000 .
> .536 .588 .673 .525 .587 .000
>
>
> N'hésitez pas à me faire remarquer toute incohérence dans mes propos !
> Merci.
>
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:52 MET