Question :
Que faire des données manquantes en ACP dans une matrice de variables du
milieu (t°, NH4, pH, etc). Lorsqu'une de ces valeurs est manquante dans une
station est-il nécessaire de supprimer toute la ligne ou bien peut-on la
remplacer par -9999 ou par autre chose ?
Réponse personnelle :
A mon avis, s'il manque trop de valeurs sur une même ligne (date, stations),
il vaut mieux la virer de l'analyse. Mais pour une seule valeur manquante,
je propose
une moyenne de la variable calculée à partir du tableau analysé ou
d'une partie seulement du tableau (problèmes de variabilités saisonnière ou
spatiale) ou si possible de données externes disponibles auprès d'autres
personnes ou organismes,
soit une valeur calculée à partir d'une régression avec une autre
variable.
Ce qui l'importe, c'est de le savoir pour ne pas se lancer dans des
interprétations douteuses portant sur cette valeur.
Amicalement. Georges
Georges CARREL (eMail : georges.carrel@cemagref.fr)
CEMAGREF - Groupement d'Aix en Provence
B.P. 31 - Le Tholonet - 13612 Aix en Provence Cedex 1 - FRANCE
Telephone : (33) 04 42 66 99 74 (ligne directe)
(33) 04 42 66 99 72 (secretariat)
(33) 04 42 66 99 10 (standard)
Fax : (33) 04 42 66 99 34
Web Cemagref : http://www.cemagref.fr
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:59 MET