Re: ADEList : DonnXes incomplXtes

From: Philippe Aubry (philippe.j.aubry@wanadoo.fr)
Date: Mon May 12 2003 - 16:00:22 MEST


Re bonjour,

> >En revanche, l'algorithme NIPALS développé dans le domaine de la PLS
permet
> >de traiter directement ce genre de configuration, la gestion des données
> >manquantes faisant partie de l'algorithme.

Réponse de Jean-Thioulouse :

> Je pense que Stephane Dray doit avoir une fonction R qui fait une ACP
NIPALS.
> Il est occupe ces jours-ci par le concours du CNRS, mais si les trains le
lui
> permettent il devrait bientot pouvoir repondre a la question. Ca n'est pas
> dans la version offcielle d'ADE4.

C'est sans doute la meilleure réponse au problème spécifique des données
manquantes en ACP, et on peut s'étonner de ne pas la trouver plus souvent
implémentée dans les logiciels de statistique tellement ce problème est
fréquent en pratique (je ne parle pas spécifiquement d'ADE mais des
logiciels en général, à part SIMCA évidemment).

> >J'ai lancé il y a quelques semaines le sujet du bootstrap de l'ACP etc.
sur
> >le forum. Je pense que c'est une approche que l'on devrait implémenter
plus
> >souvent, qui serait utile dans certaines disciplines (peut être pas en
> >écologie), notamment en face d'interlocuteurs sceptiques, je suis donc de
> >l'avis de François Mercier : il y a un besoin à ce niveau.

Réponse de Jean-Thioulouse :

> Ce n'est plus tellement un probleme d'implementation. Avec R et les
sources
> d'ADE4 dans R, il suffit de quelques minutes pour faire ce genre de
choses,
> et avec la puissance des ordinateurs actuels on peut bootstrapper une ACP
> sans probleme. Je l'avais fait il y a une vingtaine d'annees (en fait
c'etait meme un STATIS), mais l'article avait ete refuse a juste titre
parceque je
> n'avais pas fait la biblio avant. Comme toujours le probleme est d'abord
de
> savoir pourquoi on veut faire ca.
> C'est ici a mon avis un faux probleme et plutot une discussion de
chapelles.
> Le fait que les methodes d'analyse multivariee soient "guidees par les
donnees"
> est un avantage pour les statisticiens et un inconvenient pour les
modelisteurs.
> Utiliser une technique de validation issue de la modelisation pour faire
de
> l'analyse de donnees ne me parait pas etre une demarche tres coherente.

C'est sans aucun doute juste pour des méthodes telles que l'ACP ou l'AFC
dans un contexte d'utilisation classique (analyse de données), pour l'AFD
qui a aussi une fonction modélisatrice, la question de la validation croisée
est importante.

Cordialement

Philippe Aubry



This archive was generated by hypermail 2b30 : Tue Sep 07 2004 - 13:45:21 MEST