Ou couper l'arbre ?

From: Eric Laloum (laloum@pcm.ecp.fr)
Date: Tue Jun 03 1997 - 21:25:20 MET DST


Bonjour,

Je m'apercois que la question (mal posee ?) de Philip Roche du 27/05/97 est
restee sans reponse. En re-voici la teneur :

Pourriez vous me dire quel est la méthode de troncature d'une hierarchie
utilisée dans le module Clusters ?
Les résultats différent de la troncature que l'on est suceptible
d'obtenir si l'on coupe (au sens propre) un dendrogramme.

J'ai lu la fiche Clusters et je crois qu'il n'y a pas de "methode de
troncature" pour les arbres obtenus par ADE, c'est a dire qu'etant donne
une arborescence, il n'y a pas de moyen direct (avec ADE-4) de savoir ou
couper l'arbre et donc de savoir combien il faut garder de classes.

Par contre j'ai quelques petites idees (qui ne demandent qu'a etre
debattues) sur le choix du niveau de coupure.

1) On peut tester entre differents niveaux de coupure, donc differentes
partitions des individus, celui qui donne le meilleur resultat pour une
analyse discriminante (module discrimin -> Discriminant analysis/Test).

2) A chaque fois qu'on descend dans l'arborescence (de 1 classe contenant
tous les individus jusqu'a n classes contenant chacune 1 individu),
l'inertie inter-classe augmente (de 0 jusqu'à l'inertie totale); si il y a
un niveau pour lequel l'augmentation est forte, on coupe a cet endroit.

3) On utilse l'option Compute partition du module Clusters pour differentes
partitions correspondant a differents niveaux de coupure et on teste si la
partition optimale calculee par la methode des centres mobiles est
differente de la partition initiale. Le niveau de coupure pourrait etre
celui (s'il existe) correspondant a la meilleure concordance entre
partition initiale et partition recalculee.

4) On utilise l'option Prepare convex hulls du module Clusters, et on
visualise sur un plan factoriel avec ScattersClass (Stars) l'evolution des
groupes (ACP du tableau des donnees necessaire). On choisit le nombre de
classes (donc le niveau de coupure) donnant la meilleure separation.

Voila quelques idees personnelles sur la question (en supposant que cela
corresponde a la question de Philip ...).

A bientot

_____________________________________________________
Eric LALOUM
Laboratoire de Physico Chimie Moleculaire
Ecole Centrale Paris
Tel : 01 41 13 12 20



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:31 MET