Re: Analyse intra-classe et analyse interne

From: gael.didier@libertysurf.fr
Date: Wed Oct 12 2005 - 12:24:40 MEST


Bonjour à tous, J’explique plus en détail mon problème. Les données : tableau de contingence croisant les CSP en ligne (9 modalités) et les diplômes en colonne (8 modalités) ; 1 tableau pour les hommes et 1 pour les femmes (Analyses factorielles simples et multiples, p. 199, Escofier/Pagès). Le but : faire l’analyse intra-classe, pour supprimer l’effet diplôme. Pour ce faire on prend le tableau juxtaposé horizontalement (homme, femme), que l’on transpose, puisque dans « within analysis: run » de Discrimin, ce sont les lignes qui sont partitionnées. *Analyse intra via Discrimin* Procédure : 1/ AFC (COA) du tableau initial transposé --> triplet statistique ; 2/ Discrimin : Initialize LinkPrep : • le triplet est celui issu de l’AFC ; • categories file : déterminé à partir des libellés des lignes :diplôme 1 … diplôme 8 diplôme 1 diplôme 8; On retrouve bien les bonnes valeurs (programmation « manuelle ») d’inertie inter et intra-classes : 0.709% et 0.291%. 3/ Discrimin : within analysis: run , en utilisant le fichier de l’étape 2. Résultats Valeurs propres, % inertie; % cumulé 01 +2.3475E-01 +0.6085 +0.6085 02 +5.9647E-02 +0.1546 +0.7631 03 +4.0317E-02 +0.1045 +0.8676 04 +3.4937E-02 +0.0906 +0.9581 05 +8.4285E-03 +0.0218 +0.9800 06 +6.7795E-03 +0.0176 +0.9975 07 +5.9281E-04 +0.0015 +0.9991 08 +3.5278E-04 +0.0009 +1.0000 09 +0.0000E+00 +0.0000 +1.0000 Je me contente de donner les valeurs propres. Le reste en découle. Puisque l’analyse interne est équivalente à une analyse intra lorsque les colonnes ne sont pas partitionnées, on en réalise une: *Analyse Interne via COA* Fichier d’entrée : le fichier initial transposé ; Row indicator : les lignes sont partitionnées en 8/8 (8 lignes hommes puis 8 lignes femmes) ; Col indicator : par défaut, puisque les colonnes ne sont pas partitionnées ; Résultats Valeurs propres, % inertie; % cumulé 01 +5.3622E-01 +0.4871 +0.4871 02 +2.0407E-01 +0.1854 +0.6725 03 +1.4025E-01 +0.1274 +0.7999 04 +1.1485E-01 +0.1043 +0.9042 05 +4.5884E-02 +0.0417 +0.9459 06 +3.8065E-02 +0.0346 +0.9805 07 +1.9988E-02 +0.0182 +0.9986 08 +1.5002E-03 +0.0014 +1.0000 09 +0.0000E+00 +0.0000 +1.0000 Les valeurs propres entre les 2 méthodes sont totalement différentes. Celles de la méthode Discrimin correspondent à celles données par Escofier/Pagès. Les valeurs propres de la méthode Internal COA sont identiques à la programmation que j’ai faite selon l’article de Cazes/Moreau : Analyse des correspondances d’un tableau de contingence dont les lignes et les colonnes sont munies d’une structure de graphe bistochastique (dans « l’Analyse des correspondances et les techniques connexes ») : Analyse de Benzécri, 1983 : AFC sur le tableau k_{ij}-k_{i.}*k_{pj}/k_{p.}+k_{i.}*k_{.j}/k, où k_{ij} est le tableau initial, les lignes sont partitionnées selon p classes, k est la comme des k_{ij}, les autres notations étant assez évidentes je pense. Peut-être quelque chose m’échappe, mais je ne vois pas pourquoi les 2 méthodes (Internal COA et within analysis de Discrimin) donnent des résultats différents. A votre disposition pour tout éclaircissement éventuel. Merci d’avance de votre aide précieuse. Bien cordialement Gaël DIDIER En pièce jointe, si ca passe : data : le tableau de contingence (format binaire) dataT : le tableau de contingence transposé (format binaire) bloc col : la partition des colonnes (format binaire) bloc col T : la partition des colonnes du tableau transposé (format binaire) bloc ligne : la partition des lignes (format binaire) bloc ligne T: la partition des lignes du tableau transposé (format binaire) ligneT.txt : les libellés des lignes du tableau transposé colonnesT.txt: les libellés des colonnes du tableau transposé En cas d’oubli, n’hésitez pas à me demander. ---------- Initial Header ----------- From : owner-adelist@biomserv.univ-lyon1.fr To : "\":ADELIST\"@univ-lyon1.fr"@univ-lyon1.fr: <adelist@biomserv.univ-lyon1.fr> Cc : Date : Thu, 06 Oct 2005 14:15:24 +0200 Subject : Re: Analyse intra-classe et analyse interne Je ne sais pas si quelqu'un répondra à cette question : les renseignements donnés sont très sommaires. On peut préciser que : 1) on peut discuter sur des données : citez vos sources exactement 2) on peut discuter sur des procédures : citez vos sources exactement 3) on peut discuter sur des résultats : citez vos sources exactement Les auteurs que vous citez n'ont jamais brillé par la transparence. J'ai screené toute la littérature de B. Escofier, en particulier les rapports INRIA pour retrouver les données sur les vins d'ANJOU qui ont servi à faire toutes les illustrations sur l'AFM. J'ai fini par avoir une photocopie de photocopie de listing d'imprimante à barre où on faisait difficilement la différence entre les 0, les 6 et les 8. Pour retrouver les données, j'ai essayé toutes les combinaisons variables par variables pour retrouver les moyennes indiquées qui étaient éditées avec 7 chiffres significatifs. C'est la carte AFMult dans ADE-4 et data(escopage) dans ade4. Il est essentiel de disposer des données publiques pour comparer les procédures. De quelles données parlez-vous ? Sinon, notre bon coeur bien connu va nous obliger à nous arracher les cheveux (enfin, ce qu'il en reste) par compassion. ------------ ALICE HAUT DEBIT A 29,95 EUR/MOIS ------------ ALICEBOX, l'offre Internet tout en 1 : ADSL, téléphonie, modem Wi-Fi et en exclusivité la hotline gratuite 24h/24 ! Soumis à conditions. Pour en profiter cliquez ici http://abonnement.aliceadsl.fr




This archive was generated by hypermail 2b30 : Tue Oct 18 2005 - 10:35:40 MEST