Re: CLUSTER

From: Jean Thioulouse (Jean.Thioulouse@biomserv.univ-lyon1.fr)
Date: Mon Oct 12 1998 - 16:46:37 MET DST


"Cicogna Veronica" <VERCIC@chiostro.univr.it>ecrit:
>I) Comme je ne possede pas la bibliographie necessaire (Lebart-
>Morineau-Piron: "Statistique exploratoire multidimensionelle", 1995,
>Dunod, Paris, Section 2.1),j'aimerais connaitre les formules
>mathematiques correspondantes aux resultats que "COMPUTE PARTITION"
>me fournit:

Ce n'est pas tres pratique a expliquer par mail. Je vous conseille
de recuperer la bibliographie.

>II) J'ai aussi essayer d'appliquer "CLUSTERS: COMPUTE DISTANCES" a
>mes donnees, necessaire pour obtenir le Dendrograms, mais
>l'ordinateur n'arrive pas a calculer la matrice des distances
>euclidiennes: il y a des problemes de memoire qui n'est pas
>suffisante. C'est possible?

Pour 11064 objets il faudrait environ 1 Go (1000 Mo) de memoire,
et le calcul prendrait sans doute bien trop longtemps.

L'avantage de l'algorithme de partitionnement est qu'il ne fait pas
intervenir la matrice de distances. Il devrait donc marcher meme avec
assez peu de memoire. On peut ensuite faire une classification sur les
groupes obtenus.

On peut aussi utiliser la CAH sur le critere du moment d'ordre 2 (Ward),
qui ne garde que le tableau de donnees en memoire.

--
Jean Thioulouse - Laboratoire de Biometrie -  Universite Lyon 1
69622 Villeurbanne Cedex - France           Fax: 04 78 89 27 19
Tel: 04 72 43 29 01 http://pbil.univ-lyon1.fr/ADE-4/JTHome.html



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:02 MET