ordination problem with species abundance

From: Patrick Bungener (bungener@bluewin.ch)
Date: Sat Apr 15 2000 - 12:42:20 MET DST

<x-charset iso-8859-1>Hi everybody,

Because some of you only speak french I'm sending you my message above using
both French and English speaking.

Working with matrix containing species abundance data (biomass) x sites in
successive time, I want to have some informations about the use of
multivariate analysis such PCA (principal component) and CA

--------------(first in English)
1) As you probably know the problem of too much zeros in matrix abundance
data can lead serious problem with a PCA analyse (see Legendre and ter Braak
works) and should be replace by CA analysis. Furthermore, most authors
recommend to use PCA only when the sampling sites cover very short
ecological gradient (the length of the ecological gradient can be seen by
the length displayed in the first DCA axe in DCA analysis, and is in unit of
the average standart deviation (SD) of species turnover following Gauch 1982
However most authors do not give critical level for these problems, there
always use recommendation using expressions such as "not too long gradient"
or "not too many zeros". Can someone give me practical value for this from
their previous experience, i.e. critical level of percent of zeros in matrix
species abundance data and/or length of ecological gradient above which PCA
should be replace by CA analysis?

2) If a CA should be used, has someone got ideas about the necessity of an
optimal transformation of the species abundance (f or instance log or root
transformation) to get normalized data because this point has not yet been
fully adressed in the litterature. This question is also adressed for the
environmental variables in CCA (canonical analysis). Should we tranform them
before analysis?

3) Can someone tell me his deepseated opinion about the use of ordinations
(such as biplot) to detect discontinuities in multivariate series? In his
last edition of "numerical ecology", Legendre & Legendre did not recommend
it because they saw in using method of ordination major drawbacks (such as
the problem of the "spoon shape" deformation of the circle of successive
observations). An opposed opinion was from works of ter Braak. So what to
think following your experience? Are they other better suitable multivariate
statistical methods that you have already tested and with you are happy with
to detect change in data set?

Thanks a lot for your reply, Patrick Bungener

-------------- (now in French!)

Travaillant avec des matrices du type abondance d'espece (biomasse) x site
au cours du temps, je desirerais avoir quelques informations sur l'emploi
des methodes multivariees telles que ACP (composante principale) et AC

1) Le probleme des zeros dans les matrices ecologiques semble poser de
serieux problemes avec des analyses du type ACP, et bon nombre d'auteurs
recommande d'utiliser a la place l'analyse de correspondance. De plus
l'analyse en AC est egalemment recommandee losque le gradient ecologique des
site est fort (la longueur d'un gradient ecologique dans une matrice
ecologique correspondant a celle du premier axe DCA dans une analyse DCA
de cette meme matrice, et est un unite d'ecart type moyen du turnover
d'espece le long de ce gradient).
Cependant, nombre d'auteurs emploient des termes vagues "gradient trop
longs/trop courts" ou "trop de zeros" pour conseiller leur lecteur a
demarrer sur une ACP ou une AC. Quelqu'un saurait-il me dire -de par son
experience- a partir de quel pourcentage de zeros presents et de quel seuil
de longueur de gradient ecologique dans une matrices sites x especes doit on
considerer ce probleme comme reel et donc renoncer a effectuer une ACP pour
faire a la place une analyse de correspondance?

2) A propos de la (multi-)normalite des variables-especes dans une matrice,
il semble bien reconnu que celle-ci est benefique pour les ACP (bien qu'elle
ne soit pas indispensable, l'ACP etant relativement robuste). Grace a la
normalite des donnees la structure ecologique est mieux mis en evidence dans
des diagrammes d'ordination dans les ACP. Est-ce egalement valable pour
l'analyse de correspondance et pour l'analyse canonique de correspondance?
En d'autres termes, quelqu'un sait-il s'il faut transformer de maniere
optimale (par racine, log) les donnees d'abondance d'espece (pour l'analyse
de correspondance) et les variables environnementales (pour l'analyse
canonique de correspondance) pour les rendre normales avant de debuter de
telles analyses? Ou est-ce non necessaire. Sur ce sujet rien n'est clair!

3) Quelqu'un a -t-il une opinion sur l'emploi des methodes d'ordination (tel
sous forme "biplot") pour detecter des changements dans une serie temporelle
multivariee ecologique? Dans sa derniere edition de "numerical ecology" en
effet, Legendre & Legendre ne recommandent pas de telles methodes pour de
tel type de donnees parce qu'ils voient la de nombreux problemes
(deformation du cercle des observation dans l'espace reduit, etc...). Ter
Braak, dans ses travaux, lui semble de son cote beaucoup plus positif pour
l'emploi de telles methodes avec ce type de donnee. Alors que penser? Que
penser d'apres votre propre experience? Connaissez-vous d'autres methodes
plus propices -et praticable avec de grands sets de donnee- pour l'analyse
des changements dans les series temporelles multivariees ecologiques?

Un grand merci d'avance, Patrick Bungener

Dr Patrick Bungener
Institute of Environmental Protection and Agriculture (IUL) Liebefeld
Section LP
Schwarzenburgstrasse 155
3003 Bern, Switzerland

Phone: ++41 (0)31 323 83 52
Fax: ++41 (0)31 323 84 15
Email: patrick.bungener@iul.admin.ch
P: bungener@bluewin.ch


This archive was generated by hypermail 2b30 : Mon Feb 12 2001 - 09:24:54 MET