Re: CLUSTER

From: Jean Thioulouse (Jean.Thioulouse@biomserv.univ-lyon1.fr)
Date: Sat Oct 17 1998 - 19:20:00 MET DST


J'ai legerement modifie l'interface du module Clusters afin qu'on puisse utiliser
la CAH sur le critere du moment d'ordre 2 (methode de Ward) sans avoir a calculer
la matrice de distance entre les objets (ce qui est inutile dans l'algorithme
utilise par cette methode). Cela permet d'utiliser cette methode avec un nombre
d'objet beaucoup plus grand sans probleme. La nouvelle version est disponible sur
le serveur. La taille de la memoire necessaire (en octets) pour effectuer la
classification avec cette methode est donnee par m = nl * (nc + 6) * f avec
nl = nombre d'objets, nc = nombre de variables et f = 8 (PowerMacs & Windows 95)
ou f = 10 (autres Macs). Il faut donc moins de 1 Mo pour 10 000 objets et 5 variables.
Pour les autres algorithmes de classification la taille de la memoire necessaire
est m = (nl * nl + nl * 7 + nl * (nl - 1) / 2 ) * f ce qui interdit d'effectuer
les calculs sur un grand nombre d'objets (il faudrait environ 1,2 Go de memoire
pour 10 000 objets).

--
Jean Thioulouse - Laboratoire de Biometrie -  Universite Lyon 1
69622 Villeurbanne Cedex - France           Fax: 04 78 89 27 19
Tel: 04 72 43 29 01 http://pbil.univ-lyon1.fr/ADE-4/JTHome.html



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:02 MET