RE: AFCVI avec ACM?

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jun 17 1997 - 07:45:54 MET DST


Mard Deconchat pose une question qui appelle une réponse générale. De nombreuses méthodes utilise un tableau dont une des marges, voire les deux, est accompagné d'une partition, c'est à-dire que les objets de cette marge (lignes ou colonnes) sont rangés par catégorie.

Par exemple, les colonnes d'un tableau de variables floues, les lignes d'un tableau d'analyse discriminante, les lignes et les colonnes d'un tableau de Burt sont rangées par paquets.

Pour éviter de tout mélanger, il y a deux cas.

Cas n° 1 : les objets sont dans un ordre quelconque qui n'a aucune relation avec la mise en classe. C'est la cas typique des problèmes d'inter-intra classes. Cela signifie que les lignes 1, 2, ..., n appartiennent aux classes c(1), c(2), ... c(n). c est une variable qualitative qui prend les valeurs 1, 2, ..., m où m est le nombre tiotal de classes (modalités). C'est une colonne d'un tableau de variables qualitatives (souvent l'unique colonne). Chaque classe a au moins 1 élément et tout élément est dans une classe. L'option CategVar : Read Categ File préalable à tout autre usage lit le fichier, compte le nombre de classes, le nombre d'éléments par classe, vérifie les contraintes et crée un fichier .cat qui sera le seul point d'accés à la variable c. Il n'y a rien à comprendre car si le module veut un fichier .cat, il le dit et ne propose à la boite de dialogue que des fichiers .cat. Si il n'en trouve pas, la liste est vide et l'exécution du module est impossible. Une analyse inter-classe, une analyse intra-classe, une analyse discriminante, les étoiles de ScatterClass : Stars, le multifenêtrage par groupes, etc., utilise un fichier .cat.

Cas n° 2 : les objets sont rangés par classes dans l'ordre naturel. C'est la cas typique des K-tableaux. Cela veut dire que tous les objets de la classe 1 se suivent pour former un bloc de n1 objets, tous les individus de la classe 2 se suivent pour former un bloc de n2 objets, ..., tous les objets de la classe m se suivent pour former un bloc de nm objets. L'information est contenue dans un fichier binaire contenant sur une seule colonne les nombres n1, n2, ..., nm. L'utilisation d'un tel fichier appelé indicateur de blocs vérifie simplement que n1+n2+...+nm vaut le nombre total d'objets. Par exemple dans COA : Internal COA, qui fait l'AFC interne (Cazes, P., Chessel, D. & Doledec, S. (1988) L'analyse des correspondances internes d'un tableau partitionné : son usage en hydrobiologie. Revue de Statistique Appliquée : 36, 39-54) on utilise un tableau d'AFC qui peut être partitionné sur les lignes (row indicator) et/ou sur les colonnes (col indicator) car on impose que la double partition se fait par blocs d'objets contigüs. Par contre l'option Discrimin : Initialize/LinkPrep demande un fichier .cat car on n'impose pas que les lignes du fichiers soient dans l'ordre des classes.

Enfin, il y a des utilitaires qui passent d'un système à l'autre

TextToBin : BlocTo1Categ fabrique un . cat à partir d'un indicateur de blocs
CategVar : Categ->Bloc fabrique un indicateur de blocs avec un .cat si la variable sélectionnée le permet (elle doit valoir dans ce cas 1, 1, ..., 1, 2, 2, ..., 2, ..., m, m, ..., m)

Dans l'exemple Ardèche, 43-35 il y a indicateur de bloc de lignes en 4 groupes de 11, 3, 13, 16 lignes et un indicateur de blocs de colonnes en 6 groupes de 5, 6, ..., 6 colonnes. Pour faire une inter-classes, il faudrait passer d'un des deux indicateurs de blocs à un .cat mais pour faire une double intra-classes (AFC internes) il faudrait utiliser les indicateurs de blocs. Dans l'exemple Ombres pour faire une analyse discriminante il faudrait utiliser le fichier Pop.car qui donne le fichier binaire Pop qui donne le fichier Pop.cat. Mais pour faire un Statis sur les matrices de covariances, il faudrait utiliser le champ BlocPop.txt qui donnerait l'indicateur de bloc binaire BlocPop. Les cartes de données suivant leur position pédagogique contient l'une ou l'autre ou les deux notations.

Cordialement

>J'ai tenté de réaliser une AFC interclasses comme conseillé, mais je ne parviens pas à comprendre quelle doit être la structure du fichier " row indicator ". Dans l'exemple, ce fichier est 4*1 et il est appliqué à des données 43*35. J'ai un fichier monocolonne qui indique pour chaque placette à quelle station elle appartient. Que dois-je en faire ? Comme proposé dans l'exemple, j'ai tenté de lui appliquer Blocto1categ, sans succès. J'en ai fait une categorie (readcateg) sans succes. J'ai ordoné mes données et ce fichier selon la valeur des stations, sans succès. L'aide sur Blocto1categ ne m'a pas beaucoup éclairé.

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:33 MET