Re: variables semi-quantitatives

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Wed Jun 30 1999 - 17:50:06 MET DST


La question de Marc Deconchat a une solution explicite dans

Cazes, P. (1990) Codage d'une variable continue en vue de l'analyse des correspondances. Revue de Statistique Appliquée : 38, 35-51.

Cazes parle des méthodes d'introduction d'une variable quantitative dans l'AFC et ses dérivées par mise en classe.
On peut considérer que l'enregistrement de variables semi-quantitative est une mise en classe expérimentale et pose le même problème.

Il parle des codages généraux qui passent d'une variable disjonctive à p modalités à une variable floue à q modalités, par exemple :
En colonne les valeurs de la variable semi quantitative (7 niveaux)
en lignes les modalités du codage flou (4 modalités)

1 1/2 0 0 0 0 0
0 1/2 1 1/2 0 0 0
0 0 0 1/2 1 1/2 0
0 0 0 0 0 1/2 1

ou

1 2/3 1/3 0 0 0 0
0 1/3 2/3 1 2/3 1/3 0
0 0 0 0 1/3 2/3 1

Curieusement, toute la biblio citée est benzécriste (aïe !)

Pour reprendre la réponse d'Antoine Guisan, il faut bien préciser qu'une variable quantitative x (valeurs 0, 1, ..., m) peut devenir une variable qualitative (factor(x)) ou ordinale (ordered(x)). Quand on utilise les deux derniers cas dans un modèle linéaire la différence entre les deux est subtile. Le sous-espace engendré est le même et les prévisions obtenues sont les mêmes. Seuls changent les contrasts c'est à dire les combinaisons d'indicatrices de classe qui servent de base au sous-espace correspondant. Le premier contraste est exactement la variable quantitative elle-même (ça veut dire

x = 0 0 0 1 1 1 2 2 2 3 3 3 variable quantitaive à valeurs 0, 1, 2 ou 3

I1= 1 1 1 0 0 0 0 0 0 0 0 0 indicatrice de la classe 1
I2= 0 0 0 1 1 1 0 0 0 0 0 0 indicatrice de la classe 2
I3= 0 0 0 0 0 0 1 1 1 0 0 0 indicatrice de la classe 3
I4= 0 0 0 0 0 0 0 0 0 1 1 1 indicatrice de la classe 4

contraste (0,1,2,3)

x1 = 0*I1+1*I2+2*I3+3*I4 = x combinaison d'indicatrices)

Le deuxième contraste est du type (-1,1,1,-1) qui donne

x2 = -1*I1+1*I2+12*I3-13*I4 = -1 -1 -1 1 1 1 1 1 1 -1 -1 -1
 
ce qui fait que travailler sur les contrastes x1, x2 ou sur les variables x et x^2 c'est à peu près la même chose. Donc pour introduire les variables qualitatives à modalités ordonnées on peut choisir soit de recoder soit de rajouter le carré.

>Voici une question de base sur laquelle j'aimerais quelques rappels (il me
>semble qu'il y a deja eu quelques discussions sur le sujet, mais je ne parviens
>pas a le retrouver).
>
>J'ai une variable semi-quantitative et je ne sais pas tres bien comment m'en
>servir...
>Il s'agit de 9 classes de station type de terrain; elles sont ordonnees suivant
>un gradient, mais la classe 2 n'est pas la "moitie" de la classe 4.
>Si je la considere comme quantitative, il me semble que mon codage influence le
>resultat et les analyses font comme si la classe 2 etait moitie de la 4!. Si je
>la considere comme qualitative, je perds l'info concernant l'ordre, la classe 2
>est consideree comme autant differente de la 3 que de la 9.
>
>Quelle strategie avoir face a ce genre de probleme, finalement assez courant?
>Est-ce qu'il y a des methodes (ou des projets) pour traiter ces situations?
>J'ai l'impression que les methodes floues (fuzzy) pourraient repondre en partie
>a cette question. Si chaque classe est codee sous forme d'une variable, et si
>je decide qu'un individu appartenant a la classe 2 sera en fait code avec 0.1
>pour la classe 1, 0.8 pour la 2 et 0.1 pour la 3, est-ce que je n'introduis pas
>ainsi une information sur la semi-continuite des variables? Resterait a choisir
>le niveau de repartion entre les classes adjacentes...

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 http://pbil.univ-lyon1.fr/ADE-4/ADE-4F.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:00 MET