Réf. : Re: ADEList : Données incomplètes

From: f.mercier@fournier.fr
Date: Tue May 13 2003 - 10:27:15 MEST


En l'occurence, j'utilise les techniques d'analyses multivariées (ACP et
dérivées) comme étape intermédiaire de synthèse de l'information :
      - Etape 1 : ACP sur 15 variables
      - Etape 2 : Analyse inférentielle sur les axes principaux (relevants)
de l'ACP
Il est donc important dans ce contexte de savoir si les axes principaux
issus de l'ACP sont "stables" ou pas. Le bootstrap devrait me permettre de
répondre à cette question.
Qu'en pensez vous ?
Merci,
Cordialement,
F

                                                                                                                                                    
                      Jean Thioulouse
                      <Jean.Thioulouse@biomserv.uni Pour : adelist@biomserv.univ-lyon1.fr
                      v-lyon1.fr> cc :
                      Envoyé par : Objet : Re: ADEList : Données incomplètes
                      owner-adelist@biomserv.univ-l
                      yon1.fr
                                                                                                                                                    
                                                                                                                                                    
                      12/05/03 13:54
                                                                                                                                                    
                                                                                                                                                    

"Philippe Aubry" <philippe.j.aubry@wanadoo.fr> ecrit:
>> Question 1 : Les fonctions d'ACP, AFC programmees sous R
permettent-elles
>> de gerer des donnees incompletes.
>En revanche, l'algorithme NIPALS développé dans le domaine de la PLS
permet
>de traiter directement ce genre de configuration, la gestion des données
>manquantes faisant partie de l'algorithme.

Je pense que Stephane Dray doit avoir une fonction R qui fait une ACP
NIPALS.
Il est occupe ces jours-ci par le concours du CNRS, mais si les trains le
lui
permettent il devrait bientot pouvoir repondre a la question. Ca n'est pas
dans la version offcielle d'ADE4.

>J'ai lancé il y a quelques semaines le sujet du bootstrap de l'ACP etc.
sur
>le forum. Je pense que c'est une approche que l'on devrait implémenter
plus
>souvent, qui serait utile dans certaines disciplines (peut être pas en
>écologie), notamment en face d'interlocuteurs sceptiques, je suis donc de
>l'avis de François Mercier : il y a un besoin à ce niveau.

Ce n'est plus tellement un probleme d'implementation. Avec R et les sources
d'ADE4 dans R, il suffit de quelques minutes pour faire ce genre de choses,
et avec la puissance des ordinateurs actuels on peut bootstrapper une ACP
sans probleme. Je l'avais fait il y a une vingtaine d'annees (en fait
c'etait meme un STATIS), mais l'article avait ete refuse a juste titre
parceque je
n'avais pas fait la biblio avant. Comme toujours le probleme est d'abord de
savoir pourquoi on veut faire ca.

C'est ici a mon avis un faux probleme et plutot une discussion de
chapelles.
Le fait que les methodes d'analyse multivariee soient "guidees par les
donnees"
est un avantage pour les statisticiens et un inconvenient pour les
modelisteurs.
Utiliser une technique de validation issue de la modelisation pour faire de
l'analyse de donnees ne me parait pas etre une demarche tres coherente.

Jean

--
Jean Thioulouse - Labo. BBE - UMR CNRS 5558 - Equipe "Ecologie Statistique"
Universite Lyon 1,   Batiment G. Mendel,  69622 Villeurbanne Cedex,  France
Tel/Fax: (33) 4 72 43 27 56           http://pbil.univ-lyon1.fr/JTHome.html



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:45:21 MEST