Bonjour à tous,
J’explique plus en détail mon problème.
Les données : tableau de contingence croisant les CSP en
ligne (9 modalités) et les diplômes en colonne (8 modalités)
; 1 tableau pour les hommes et 1 pour les femmes (Analyses
factorielles simples et multiples, p. 199, Escofier/Pagès).
Le but : faire l’analyse intra-classe, pour supprimer
l’effet diplôme. Pour ce faire on prend le tableau juxtaposé
horizontalement (homme, femme), que l’on transpose, puisque
dans « within analysis: run » de Discrimin, ce sont les
lignes qui sont partitionnées.
*Analyse intra via Discrimin*
Procédure :
1/ AFC (COA) du tableau initial transposé --> triplet
statistique ;
2/ Discrimin : Initialize LinkPrep :
• le triplet est celui issu de l’AFC ;
• categories file : déterminé à partir des libellés des
lignes :diplôme 1 … diplôme 8 diplôme 1 diplôme 8;
On retrouve bien les bonnes valeurs (programmation «
manuelle ») d’inertie inter et intra-classes : 0.709% et 0.291%.
3/ Discrimin : within analysis: run , en utilisant le
fichier de l’étape 2.
Résultats
Valeurs propres, % inertie; % cumulé
01 +2.3475E-01 +0.6085 +0.6085
02 +5.9647E-02 +0.1546 +0.7631
03 +4.0317E-02 +0.1045 +0.8676
04 +3.4937E-02 +0.0906 +0.9581
05 +8.4285E-03 +0.0218 +0.9800
06 +6.7795E-03 +0.0176 +0.9975
07 +5.9281E-04 +0.0015 +0.9991
08 +3.5278E-04 +0.0009 +1.0000
09 +0.0000E+00 +0.0000 +1.0000
Je me contente de donner les valeurs propres. Le reste en
découle.
Puisque l’analyse interne est équivalente à une analyse
intra lorsque les colonnes ne sont pas partitionnées, on en
réalise une:
*Analyse Interne via COA*
Fichier d’entrée : le fichier initial transposé ;
Row indicator : les lignes sont partitionnées en 8/8 (8
lignes hommes puis 8 lignes femmes) ;
Col indicator : par défaut, puisque les colonnes ne sont pas
partitionnées ;
Résultats
Valeurs propres, % inertie; % cumulé
01 +5.3622E-01 +0.4871 +0.4871
02 +2.0407E-01 +0.1854 +0.6725
03 +1.4025E-01 +0.1274 +0.7999
04 +1.1485E-01 +0.1043 +0.9042
05 +4.5884E-02 +0.0417 +0.9459
06 +3.8065E-02 +0.0346 +0.9805
07 +1.9988E-02 +0.0182 +0.9986
08 +1.5002E-03 +0.0014 +1.0000
09 +0.0000E+00 +0.0000 +1.0000
Les valeurs propres entre les 2 méthodes sont totalement
différentes.
Celles de la méthode Discrimin correspondent à celles
données par Escofier/Pagès.
Les valeurs propres de la méthode Internal COA sont
identiques à la programmation que j’ai faite selon l’article
de Cazes/Moreau : Analyse des correspondances d’un tableau
de contingence dont les lignes et les colonnes sont munies
d’une structure de graphe bistochastique (dans « l’Analyse
des correspondances et les techniques connexes ») :
Analyse de Benzécri, 1983 :
AFC sur le tableau
k_{ij}-k_{i.}*k_{pj}/k_{p.}+k_{i.}*k_{.j}/k, où k_{ij} est
le tableau initial, les lignes sont partitionnées selon p
classes, k est la comme des k_{ij}, les autres notations
étant assez évidentes je pense.
Peut-être quelque chose m’échappe, mais je ne vois pas
pourquoi les 2 méthodes (Internal COA et within analysis de
Discrimin) donnent des résultats différents.
A votre disposition pour tout éclaircissement éventuel.
Merci d’avance de votre aide précieuse.
Bien cordialement
Gaël DIDIER
En pièce jointe, si ca passe :
data : le tableau de contingence (format binaire)
dataT : le tableau de contingence transposé (format binaire)
bloc col : la partition des colonnes (format binaire)
bloc col T : la partition des colonnes du tableau
transposé (format binaire)
bloc ligne : la partition des lignes (format binaire)
bloc ligne T: la partition des lignes du tableau transposé
(format binaire)
ligneT.txt : les libellés des lignes du tableau transposé
colonnesT.txt: les libellés des colonnes du tableau transposé
En cas d’oubli, n’hésitez pas à me demander.
---------- Initial Header -----------
From : owner-adelist@biomserv.univ-lyon1.fr
To : "\":ADELIST\"@univ-lyon1.fr"@univ-lyon1.fr:
<adelist@biomserv.univ-lyon1.fr>
Cc :
Date : Thu, 06 Oct 2005 14:15:24 +0200
Subject : Re: Analyse intra-classe et analyse interne
Je ne sais pas si quelqu'un répondra à cette question : les
renseignements donnés sont très sommaires.
On peut préciser que :
1) on peut discuter sur des données : citez vos sources
exactement
2) on peut discuter sur des procédures : citez vos sources
exactement
3) on peut discuter sur des résultats : citez vos sources
exactement
Les auteurs que vous citez n'ont jamais brillé par la
transparence. J'ai
screené toute la littérature de B. Escofier, en particulier
les rapports
INRIA pour retrouver les données sur les vins d'ANJOU qui
ont servi à
faire toutes les illustrations sur l'AFM. J'ai fini par
avoir une
photocopie de photocopie de listing d'imprimante à barre où
on faisait
difficilement la différence entre les 0, les 6 et les 8.
Pour retrouver
les données, j'ai essayé toutes les combinaisons variables
par variables
pour retrouver les moyennes indiquées qui étaient éditées
avec 7
chiffres significatifs. C'est la carte AFMult dans ADE-4 et
data(escopage) dans ade4. Il est essentiel de disposer des
données
publiques pour comparer les procédures. De quelles données
parlez-vous ?
Sinon, notre bon coeur bien connu va nous obliger à nous
arracher les
cheveux (enfin, ce qu'il en reste) par compassion.
------------ ALICE HAUT DEBIT A 29,95 EUR/MOIS ------------
ALICEBOX, l'offre Internet tout en 1 : ADSL, téléphonie, modem Wi-Fi et en exclusivité
la hotline gratuite 24h/24 ! Soumis à conditions. Pour en profiter cliquez ici http://abonnement.aliceadsl.fr
This archive was generated by hypermail 2b30 : Wed Oct 12 2005 - 12:29:10 MEST