Quantitatif->Qualitatif

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Jan 13 1998 - 08:43:51 MET


Ma réponse à la question d'Emmanuel Castella sur une option non traduite qui permet de recoder des variables quantitatives en qualitatives avec des bornes fixées avait entraîner un débat peu sympathique. Pour reprendre de manière plus constructive, on peut faire les remarques suivantes.

1) Pourquoi transformer du quantitatif en qualitatif ? La plupart du temps, il s'agit de rendre homogène un paquet de variables. Quand la plupart des mesures sont qualitatives et demandent une ACM une variable quantitative est recodée pour être associée à la majorité. Cette question a une solution élégante dans l'option MCA : Hill & Smith Analysis qui permet un mélange en quantité quelconque de p variable qualitatives entrant dans une ACM et de q variables quantitatives entrant dans une ACP normée. Tous les détails dans la fiche thématique 11 du volume 2 : ftp://biom3.univ-lyon1.fr/pub/mac/ADE/ADE4/DocThem/Thema2B.hqx
ou
ftp://biom3.univ-lyon1.fr/pub/mac/ADE/ADE4/DocThemPDF/Thema2B.pdf
Cette analyse a les mêmes prérogatives que PCA : Correlation matrix PCA ou MCA : Multiple Correspondence Analysis : voir en particulier dans la doc de CoInertia : Matching two statistical triplets l'exemple d'une analyse de co-inertie avec un tableau de milieu formé d'une variable qualitative et de 4 variables quantitatives.
La citation de l'article Hill, M.O. & Smith, A.J.E. (1976) Principal component analysis of taxonomic data with multi-state discrete characters. Taxon : 25, 249-255 rend cette option utilisable dans une publication.

2) Il se peut que la raison soit un essai de recherche de liaison non linéaire entre variables quantitatives par le biais d'un codage en classe. Dans ce cas, le codage flou est bien supérieur : par exemple pour 5 classes on code ceux de la première classe 0.5/0.5/0/0/0, ceux de la deuxième classe 0.25/0.5/0.25/0/0 ... et ceux de la cinquième classe 0/0/0/0.5/0.5 et l'analyse des correspondances floues sera une ACM ou la continuité des valeurs entre en ligne de compte (Il y a un excellent article de P. Cazes sur ce sujet dont je ne retrouve pas la référence). Si il y de la demande dans ce sens j'écrirai l'utilitaire associé.

3) Si on tient à recoder avec choix des bornes le logiciel StatView SE+Graphics fait cela sur le mac. Ce n'est pas un logiciel du domaine public mais la version de StatView qui tournait sur le MacPlus et qui a évolué en StatView 4.5 actuellement (3490F en promo, Abacus Concepts a vendu StatView Software à SAS Institute en sep 97). Beaucoup de labo possède une version de StatView SE+Graphics. Pour recoder des variables qualitatives :
1 - Si le programme est dans la machine, il est automatiquement retrouvé par l'interface HyperCard d'ADE-4 et apparait au menu Open en haut de la carte d'entrée de la pile ADE-*Base. S'il n'est pas encore enregistré dans l'interface, utiliser l'option Add to list... dans le menu Software et double cliquer sur le nom du programme dans son dossier. Il apparaitra alors à chaque session.
2 - Envoyer directement le fichier binaire X à StatView SE+Graphics en cliquant sur le nom du dossier de travail pour sélectionner le fichier (relacher sur l'option File Selection, puis double-cliquer sur le fichier X, puis double cliquer sur l'option Send To puis double-cliquer sur l'option StatView SE+Graphics et répondre Ok au dialogue d'entrée). Cette procédure transforme le fichier binaire ADE-4 en X-t par ADETrans puis ouvre X-t avec le logiciel sélectionné.
3 - Double cliquer sous la colonne à transformer. Il s'affiche x1 qui identifie la colonne de travail. Dans le menu Descriptif choisir l'option Distribution de fréquences, puis dans le menu menu Voir l'otion Bâtons. On a un histogrammes de la variables avec le nombre d'intervalles choisis. Noter les bornes des classes qu'on veut conserver ou laisser ouverte la fenêtre de l'histogramme pour choisir à vue.
4 - Dans le menu Outil, sélectionner Recoder.... Dans la fenêtre de dialogue choisir la variable à recoder et donner un nom à la colonne du résultat attendu. Choisir l'option Plage de valeur en valeurs spécifiées et cliquer sur recoder.
On boucle alors classe par classe. La fenêtre affiche le minimum de la classe 1 et entrer le maximum de la classe 1. Avec les boutons à cocher qui sont explicites choisir de faire des classes du type min<=x<max. Cliquer sur autre jusqu'à satisfaction. Faire la dernière classe du type min<=x<=max. Le programme quand on change de classes a l'amabilité d'afficher le max de la classe précédente dans la cas min et le max total dans la classe max. Le tout est simple d'emploi mais il faut être précis.
5 - Enlever du fichier toutes les colonnes (Command X) sauf les colonnes de recodage et sauvegarder en fichier texte dans Y.txt. On retourne dans l'interface.
6 - Sélectionner comme au départ Y.txt et relacher sur l'option Get Binary File qui transforme Y.txt en binaire sous le nom Y.

Cordialement

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:48 MET