Re: comment supprimer des variables?

From: Stephane DRAY (dray@biomserv.univ-lyon1.fr)
Date: Wed Apr 21 2004 - 00:15:47 MEST


Bonjour,

On peut voir votre question d'une maniere differente: "Comment selectionner
des variables".
Il existe la meme problematique en regression multiple. On peut y repondre
par les methodes dites "pas a pas" qui permettent de selectionner un modele
parcimonieux. Deux approches :backward (on commence avec toutes les
variables et on en enleve) et forward (on ajoute des variables).
Des criteres comme l'AIC, F peuvent etre utilises.
? step # dans R

Je suis assez sceptique sur ce type d'approche.
La solution n'est pas toujours optimale car on n'essaie pas l'ensemble des
possibilites de modeles.
Exemple en forward:je selectionne X1 qui explique le plus de variabilite de
Y, puis X2 qui explique le plus de variabilite de Y sachant X1.
Un probleme peut arriver si X3 explique moins que X1 mais X3+X4 peuvent
expliquer plus de variabilite que X1+X2.
Dans le cas de variables orthogonales, c'est plus legitime car chaque
variable explique une part differente de la variabilite de Y.

Voila pour le cas univarie.

Si on passe aux choses serieuses :-)
En multivarie, il y a possibilite de faire de la selection de variable par
test de permutation et test F emboite (modele X1X2 vs X1X2X3). C'est
disponible dans canoco et dans vegan dans R.

Reste a savoir si votre probleme c'est "j'ai pas assez de place sur ma
feuille pour pour mettre les labels de mes 17 variables sur mon graphique"
ou "j'ai des problemes de multicolinearite entre variables explicatives qui
creent une instabilite dans la regression".

Dans le deuxieme cas, l'analyse de coinertie est bien meilleure que la CCA
(cf. <http://www.steph280.freesurf.fr/files/articles/Ecology2003b.pdf>S.
Dray, D. Chessel, J. Thioulouse : Co-inertia analysis and the linking of
ecological data tables.
Ecology<http://www.steph280.freesurf.fr/files/articles/Ecology2003b.pdf>,
2003, vol. 84, 3078-3089. disponible a http://www.steph280.freesurf.fr/).
Dans le premier cas, passez au A3.

Cordialement.

At 12:07 19/04/2004, Jean- Baptiste Mouronval wrote:

>Bonjour à tous,
>J'ai réalisé une ACC à partir d'un tableau faunistique comportant 200 lignes
>et 53 colonnes et d'un tableau de variables mésologiques comportant 17
>colonnes (et bien sur 200 lignes).
>Le dépouillement de l'ACC (à l'aide de la fiche thématique ad-hoc) fournit
>des résultats convaincants et trés interprétables du point de vue
>écologique.
>Bien sur,certaines variables de milieu ont de trés faibles poids, ne sont
>corrélées à aucune autre et/ou il ya contradiction entre le poids canonique
>des variables et les corrélations codes canoniques/variables initiales (si
>j'ai bien compris).
>Afin d'obtenir des figures trés lisibles et surtout pour éviter les
>problèmes inhérents à l'introduction d'un grand nombre de variables, je
>souhaiterais en réduire le nombre.
>Ma double question est donc la suivante: peut-on (est-ce licite?) à fortiori
>supprimer des variables? si oui, sur quels critères (variables de faible
>poids, variables contributives mais non explicatives au plan écologique?)?
>
>Inutile de cacher que j'ai déja essayé, en supprimant les variables de
>faible poids, qui sont aussi les variables les moins contributives à la
>formation des premiers axes de l'ACP. Les résultats de l'ACC demeurent
>inchangés.
>
>Merci par avance pour vos remarques et propositions
>
>
>JB. MOURONVAL
>ONCFS/CNERA Avifaune Migratrice
>j.b.mouronval@oncfs.gouv.fr
>

Stéphane DRAY
--------------------------------------------------------------------------------------------------

Département des Sciences Biologiques
Université de Montréal, C.P. 6128, succursale centre-ville
Montréal, Québec H3C 3J7, Canada

Tel : 514 343 6111 poste 1233
E-mail : stephane.dray@umontreal.ca
--------------------------------------------------------------------------------------------------

Web http://www.steph280.freesurf.fr/
--------------------------------------------------------------------------------------------------



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:30:56 MEST