Re: ACM et discriminante

From: Jean Thioulouse (Jean.Thioulouse@biomserv.univ-lyon1.fr)
Date: Tue Sep 08 1998 - 10:57:52 MET DST


oraymond@univ-lyon1.fr ecrit :
>un tableau (242*16) relevant d'une ACM peut-il être traité par analyse
>discriminante afin de savoir quelles sont les modalités caractéristiques de
>groupes d'individus ?

Voici ce qui est explique dans la doc du module Discrimin (option
Discriminant analysis : Run). La pertinence de l'analyse va donc
dependre en partie du nombre de modalites des 16 variables qualitatives.
Comme c'est souvent le cas, l'analyse inter est sans doute preferable.

----------------------------------------------------------------------
La principale difficulté de l'analyse discriminante tient aux équations
des scores. Comme pour une équation de régression multiple ou d'ACP sur
variables instrumentales, les poids des variables deviennent très
rapidement instables numériquement dès que le nombre de mesures est
insuffisant. Pour avoir une idée grossière, compter 20 points
supplémentaires par variable supplémentaires. 200 lignes dans le tableau
de départ supportent, dans les meilleurs cas, 10 colonnes. En deçà, les
poids canoniques ne sont pas fiables.

Quand il y a moins de 5 individus supplémentaires par variable
supplémentaire, l'analyse est douteuse. Quand il y a plus de variables
que d'individus, elle est mathématiquement stupide. Compter une variable
par modalité pour les variables qualitatives ou floues. En cas de doute,
l'interclasse l'emporte. Après une ACM ou une AFC, l'interclasse est en
général plus simple d'interprétation.

Après une ACM, l'option permet une analyse discriminante parce qu'elle
utilise des inverses généralisés des matrices de covariances. Cette
pratique est rarement utile vu le nombre des modalités. On préfère
exécuter la discriminante sur les premières coordonnées factorielles de
l'ACM (2, Analyse factorielle discriminante qualitative, p. 275). Cette
discrimination sur composantes est l'équivalent d'une régression sur
composantes disponible dans le module OrthoVar. On lui préférera surtout
l'analyse discriminante barycentrique 5 qui est exactement l'interclasse
après une ACM. Elle est largement utilisée en raison de sa simplicité et
de sa robustesse (2, p. 276).

L'option ne permet pas la réaffectation des individus supplémentaires,
car c'est rarement un problème écologique. On notera, par exemple, que
dans l'illustration proposée par Manly, la discrimination est fortement
significative et que les résultats sont probants, mais qu'il ne peut y
avoir d'estimation possible de l'époque à partir des mesures. On
trouvera dans la fiche thématique 5.3 des analyses discriminantes après
des ACP doublement centrées.

1 Cacoullos, T. & Styan, G.P.H. (1973) A bibliography of discriminant
analysis. In : Discriminant analysis and applications. Cacoullos, T.
(Ed.) Academic Press, New York, 1-434. 375-434.

2 Lebart, L., Morineau, A. & Piron, M. (1995) Statistique exploratoire
multidimensionnelle. Dunod, Paris. 1-439.

3 McLachlan, G.J. (1992) Discriminant analysis and Statistical pattern
recognition. J. Wiley, New York.

4 Manly, B.F. (1994) Multivariate Statistical Methods. A primer. Second
edition. Chapman & Hall, London. 1-215. Exemple traîté pp. 6, 13, 51, 64,
72, 107, 112 et 117.

5 Leclerc, A. (1976) Une étude de la relation entre une variable
qualitative et un groupe de variables qualitatives. International
Statistical Review: 44, 2, 241-248.

--
Jean Thioulouse - Laboratoire de Biometrie -  Universite Lyon 1
69622 Villeurbanne Cedex - France           Fax: 04 78 89 27 19
Tel: 04 72 43 29 01 http://pbil.univ-lyon1.fr/ADE-4/JTHome.html



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:01 MET