RE: Hill & Smith

From: gilles poizat (poizat@tour-du-valat.com)
Date: Mon Mar 20 2000 - 20:08:51 MET


<x-charset iso-8859-1>Merci Daniel pour ta reponse,

pour ma premiere question, en fait, j'avais juste inverse l'ordre des variables quantitatives et qualitatives, et du coup je ne voyais pas les correspondances entre les scores et les R2 (autant pour moi !)

-----------------------------------------------
Gilles Poizat
Station biologique de la Tour du Valat
Le Sambuc, 13200 Arles, France
-----------------------------------------------

On 16/03/00, Daniel Chessel wrote:
>Bonjour,
>
>Gilles Poizat pose deux questions.
>>J'ai 2 questions a propos de >l'utilisation de l'analyse de Hill & >Smith. J'aimerais presenter les scores des >variables sur les axes sous forme de >tableau. Le fichier xx.hico me donne les >scores des variables quantitatives et les >scores des modalites des variables >qualitatives. >>1. Quand je regarde aussi le fichier >xx.hiR2, j'observe que certaines variables >quantitatives ont des scores eleves (en >valeur absolue) sur un axe, et un R2 >faible sur le meme axe. C'est normal ?, si >oui, alors l'interpretation des scores des >variables quantitatives ne serait pas >aussi directe qu'en ACP ? il faudrait >regarder a la fois les R2 et les scores >pour interpreter les axes
>
>C'est normal ? La réponse est non. La >théorie dit que les coordonnées des >variables quantitatives de cette analyse >sont des corrélations, donc que les carrés >des coordonnées sont des R2. On doit donc >le retrouver numériquement.
>
>Utiliser la carte Dune+1 (Recodage de >l'exemple fondamental de Jongman, R.H., >ter Braak, C.J.F. & van Tongeren, O.F.R. >(1987) Data analysis in community and >landscape ecology. Pudoc, Wageningen. 1-
>298.)
>
>Faire l'ACM (MCA: Multiple Correspondence >Analysis) de Qual et l'ACP normée >(PCA: Correlation matrix PCA) de Quan puis >coupler par MCA: Hill & Smith Analysis.
>
>Les R2 sont édités dans le listing
>R2 (x1000) Column = axes
>First bloc: discrete parameters
>Second bloc: continuous parameters
>Third bloc: overall mean = eigenvalue/2
>Variable : 1 445 276
>Variable : 2 860 586
>
>Variable : 1 155 514
>Variable : 2 186 456
>Variable : 3 896 26
>
>Overall mean 508 372
>File aa.hiR2 contains the R2 coefficients
>--- It has 5 rows and 2 columns
>On retrouve ces valeurs dans :
>------------------------------------------
>-------
>Binary input file: E:\Ade4\DUNE\aa.hiR2 - >5 rows, 2 cols.
> 1 | 0.4451 0.2762
> 2 | 0.8595 0.5865
> 3 | 0.1554 0.5137
> 4 | 0.1860 0.4557
> 5 | 0.8961 0.0257
>
>Les coordonnées des variables sont :
>File aa.hico contains the column scores
> 1 | 0.8381 0.6636
> 2 | -0.7049 -0.5511
> 3 | -0.0455 -0.0471
> 4 | -1.0222 -0.8492
> 5 | -0.2237 1.3380
> 6 | -0.2276 0.5566
> 7 | 1.3237 -0.2836
> 8 | 0.3942 -0.7168
> 9 | 0.4312 -0.6750
> 10 | -0.9466 -0.1604
>
>Les coordonnées des quantitatives sont >reproduites dans >File aa.hicocont contains the column >scores of continuous parameters
>--- It has 3 rows and 2 columns
>--- It contains 3 last lines from file >aa.hico
>--- It can be used for drawing correlation >circles
>------------------------------------------
>-------
>Binary input file: >E:\Ade4\DUNE\aa.hicocont - 3 rows, 2 cols.
> 1 | 0.3942 -0.7168
> 2 | 0.4312 -0.6750
> 3 | -0.9466 -0.1604
>
>On vérifie alors que > 0.3942*0.3942=0.155
>-0.7168*-0.7168=0.514
>0.4312*0.4312=0.186
>etc...
>Donc "certaines variables quantitatives >ont des scores eleves (en valeur absolue) >sur un axe, et un R2 faible sur le meme >axe" ne me semble pas possible. Les deux >sont liées par un carré. Il n'y a pas de >mystère.
>
>
>>2. Toujours pour ce tableau >d'interpretation des axes, presentant les >scores (et les R2 ?) des variables, est-ce >que ca a un sens d'y mettre les >coordonnees des modalites des variables >qualitatives ? est-ce qu'il n'y a qu'un >probleme d'echelle (les scores des >variables quantitatives sont bornes entre >-1 et 1, alors que les scores des >modalites ne le sont pas) ? ou plus grave >? >
>Il n'y a rien de grave dans tout ça. Quand >on restitue une analyse, en général on >doit prendre un point de vue et éditer ce >qui est cohérent avec ce point de vue. >Pour l'analyse d'un tableau, il y a de >nombreux points de vue qui sont différents >entre eux et ont une même solution >numérique. Quand on fait une ACP tout le >monde utilise le même programme mais >soit pour estimer des axes principaux >d'une matrices de corrélations d'une loi >de Gauss multivariée,
>soit pour estimer un modèle sous-jacent >avec une erreur gaussienne sphérique,
>soit pour chercher un code de synthèse >maximisant la somme des carrés des >corrélations avec les variables,
>soit pour avoir une représentation >euclidienne de petite dimension et >d'inertie projetée maximale,
>soit pour avoir une combinaison de >variables de variance maximale,
>soit pour reproduire la matrice des >distances entre points,
>soit pour estimer la matrice de >corrélation par une matrice de rang >minimal,
>soit pour estimer le tableau par une >matrice de rang minimal,
>etc...
>
>Quand on fait une ACM, il y a une bonne >dizaine de points de vue (Tenenhaus, M. & >Young, F.W. (1985) An analysis and >synthesis of multiple correspondence >analysis, optimal scaling, dual scaling, >homogeneity analysis ans other methods for >quantifying categorical multivariate data. >Psychometrika : 50, 1, 91-119.)
>
>Alors quand on fait les deux à la fois, il >y a bien des points de vue possibles. >Editer les R2 est un point de vue, les >coordonnées des colonnes un autre. Au >choix !
>
>Cordialement
>
>
>
>Daniel Chessel
>Universite Lyon 1 - Biométrie et Biologie >Evolutive - Bât 741
>69622 Villeurbanne CEDEX
>Tel : 04 72 44 82 77 - (33) 4 72 44 82 77
>
>
>
>
>RFC822 header
>-----------------------------------
>RECEIVED: from SF_Database by >POP_Mailbox_-1258924626 ; 16 MAR 00 >09:11:10 UT
>Received: from BIOMSERV.UNIV-LYON1.FR by >mailhost.tour-du-valat.com
> with SMTP (QuickMail Pro Server for >MacOS 1.1.2); 16-Mar-2000 09:11:08 +0100
>Received: (from majordom@localhost)
> by biomserv.univ-lyon1.fr >(8.8.7/8.8.5) id IAA21390
> for adelist-outgoing; Thu, 16 Mar >2000 08:36:40 +0100 (MET)
>X-Authentication-Warning: biomserv.univ-
>lyon1.fr: majordom set sender to owner-
>adelist using -f
>Received: from pc300gldc.univ-lyon1.fr >(pc300gldc.univ-lyon1.fr [134.214.92.199])
> by biomserv.univ-lyon1.fr >(8.8.7/8.8.5) with SMTP id IAA21383
> for <adelist@biomserv.univ-
>lyon1.fr>; Thu, 16 Mar 2000 08:36:35 +0100 >(MET)
>Message-Id: ><3.0.3.32.20000316084017.00698ff4@biomserv
>.univ-lyon1.fr>
>X-Sender: chessel@biomserv.univ-lyon1.fr
>X-Mailer: QUALCOMM Windows Eudora Light >Version 3.0.3 (32)
>Date: Thu, 16 Mar 2000 08:40:17 +0100
>To: adelist@biomserv.univ-lyon1.fr (forum)
>From: Daniel Chessel ><chessel@biomserv.univ-lyon1.fr>
>Subject: Re: Hill & Smith
>Mime-Version: 1.0
>Content-Type: text/plain; charset="iso-
>8859-1"
>Content-Transfer-Encoding: 8bit
>X-MIME-Autoconverted: from quoted-
>printable to 8bit by biomserv.univ-
>lyon1.fr id IAA21385
>Sender: owner-adelist@biomserv.univ-
>lyon1.fr
>Precedence: bulk
>
>

</x-charset>



This archive was generated by hypermail 2b30 : Mon Feb 12 2001 - 09:24:54 MET