MCA_COA_etc

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Dec 11 1997 - 14:45:02 MET


Kent Lofgren pose une question fort intéressante.

On peut préciser les choses suivantes bien connues des statisticiens et utiles pour les utilisateurs d'ADE-4. L'illustration peut se faire avec le fichier MeteoCat de la carte Meteq de la pile ADE-4*data

X est un tableau de variables qualitatives n lignes - v variables
Il est lu par CategVar : Read Categ File qui compte les modalités (m au total)
MeteoCat a 23 lignes, 7 variables et 21 modalités

Le fichier X.cat qui permet de faire l'analyse des correspondances multiples (MCA : Multiple Correspondence Analysis).
MeteoCat.cat donne une ACM avec des valeurs propres de 0.61812, 0.3508, ...

On peut le passer en disjonctif complet CategVar : Categ->Disj, ce qui donne un fichier X01 à n lignes et m colonnes
Le fichier MeteoCat01 a 23 lignes et 21 colonnes.
On peut faire l'AFC du tableau disjonctif complet avec COA : COrrespondence Analysis. On trouve exactement les mêmes valeurs propres. Observer que MeteoCat.cmli et MeteoCat01.fcli sont identiques et que MeteoCat.cmco et MeteoCat01.fcco sont identiques
Donc l'ACM est exactement l'AFC du tableau disjonctif complet (c'est la définition qu'on en donne souvent, par exemple, Rouanet, H. & Le Roux, B. (1993) Analyse des données multidimensionnelles. Dunod, paris. 1-310 p. 254.) Il vaut mieux utiliser MCA pour avoir les aides à l'interprétation appropriées.

D'autre part, CategVar : Categ->Burt donne le tableau de Burt XB (m lignes-modalités et m colonnes-modalités) et les khi2 des tables de contingence par couple de variables.
MeteoCatB a 21 lignes et 21 colonnes.
On peut faire l'AFC du tableau de BURT avec COA : COrrespondence Analysis. On ne trouve pas les mêmes valeurs propres mais 0.3821, 0.1231, ... c'est-à-dire les carrés des précédentes. Observer que MeteoCatB.fcli et MeteoCatB.fcco sont identiques et que les coordonnées de MeteoCatB.fcli sont proportionnelles à celle de MeteoCat.cmco ou son identique MeteoCat01.fcco. On a donc pratiquement la carte des colonnes d'une ACM avec l'AFC du tableau de BURT. Enfin si on projette en individus supplémentaires les lignes de X01 sur l'AFC de XB on récupère les coordonnées lignes de l'ACM de X.
DDUtil : Supplementary rows sur MeteoCatB.fcvp et LeteoCat01 redonne MeteoCat.cmli.

L'intérêt de la chose est sensible quand on fait une ACM sur 100000 lignes dont on n'a rien à faire des coordonnées des lignes. On fait directement l'AFC du tableau de BURT.

D'où la réponse à la question :

L'ACM de X, l'AFC de X01 (Disjonctif complet) et l'AFC de XB (Burt) sont organiquement liées. Quand on a qu'un tableau de BURT l'AFC simple s'impose. Un tableau disjonctif complet donne un tableau de BURT mais le retour est impossible. Quand le tableau de BURT croise deux variables (table de contingence) l'AFC simple suffit à tout faire. Quand le tableau de BURT est composé de plusieurs tables de contingence simples accolées (tableau BANDE, Bandes de tableaux, tableaux croisés sur deux paquets de variables) voir aussi CategVar : ReadTestBurt et COA : Internal COA.

Une remarque sur le fond : l'AFC et sa jumelle (ACM) s'impose sur les tables de contingence. Tous l'information nécessaire est dans Lebart, L., Morineau, A. & Piron, M. (1995) Statistique exploratoire multidimensionnelle. Dunod, Paris. 1-439. Sur tout autre type de tableau, elle se discute.
L'AFC d'une table de contingence est une technique de description : elle suppose évidemment que le chi2 est signification et que sa décomposition a un sens (sinon les méthodes de statistique inférentielle sont seules en jeu).

Cordialement

>Friends, I have a question. To run COA on ADE-4, do I always need to have
>my data in the form of a burt matrix (0-1)? If I have a cross table with
>observed frequencies (Pleas see example below), can I transform it to a
>burt matrix with the help of ADE-4? (I don't think so. So how should I
>proceed?)
>
>21 32 12 32 12
>11 12 14 10 44
>43 12 31 43 23
>12 21 23 43 34
>(Example data)
>
>4 rows, 5 columns --- how to analyse such data (observed frequencies) with
>ADE-4?

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:42 MET