Re: diagnostics for choosing response models

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Nov 25 1999 - 11:25:31 MET


Robin Bloom a posé une question très générale

>My name is Robin and I'm a graduate student in Canada. I'm
>writing to you in search of clarification of when species are
>responding linearly rather than in a unimodal way to gradients.
>Running PCA and DCA with my data provide signifantly different
>results and I want to determine which response model is most
>apprpriate. I am not willing to assume that the analysis which
>explains the most variability is using the most appropriate model. I
>prefer to address the issue the other way around. Can I estimate
>the type of response and then fit the appropriate model?
>
> For example Jongman et al. (1987) suggested that one start with
>the most general model,as in RA and DCA and examine the length
>of the resulting axes. Axes shorter than 2 standard deviations may
>allow the model to be simplified to a linear one and produce a
>better fit. My question is how does one know from the output if the
>resuting axes are sufficiently short? What do the standard
>deviations along the axis respresent (from what mean do they
>measure deviation?

La forme des courbes de réponse des espèces sur les gradients
environnementaux est au centre du choix d'une méthode d'analyse d'un
tableau écologique.

RA-DCA-PCA-PCO-ETC Comment choisir ?

Robin Bloom se réfère à la notion de longueur d'un axe d'ordination. Ce que
cette statistique signifie est très lié à la théorie de l'analyse des
correspondances. Si on prend ce qui se passe dans le module d'ADE-4
(COA: COrrespondence Analysis) on a les coordonnées des espèces (colonnes)
et des relevés (lignes) dans fic.fcco et fic.fcli. On a les poids des
espèces (colonnes) et des relevés (lignes) dans fic.fcpc et fic.fcpl. On
peut calculer les moyennes des scores de fic.fcco avec les poids de
fic.fcpc. Ces moyennes sont toujours nulles. On peut calculer les variances
des scores de fic.fcco avec les poids de fic.fcpc. Ces variances sont
toujours égales aux valeurs propres (lambda). De même on peut calculer les
moyennes des scores de fic.fcli avec les poids de fic.fcpl. Ces moyennes
sont toujours nulles. On peut calculer les variances des scores de fic.fcli
avec les poids de fic.fcpl. Ces variances sont toujours égales aux valeurs
propres (lambda).

Dans fic.fcli et fic.fcco on a des scores de moyennes nulles et variance
lambda.

Avec DDUtil: Add normed scores on peut avoir dans fic.fcl1 et fic.fcc1 les
scores de moyennes nulles et variances 1 (il a suffit de diviser par
sqrt(lambda). L'intérêt est que si on prend fic.fcl1 et fic.fcco on a les
espèces à la moyenne des relevés et si on prend fic.fcc1 et fic.fcli on a
les relevés à la moyenne des espèces. On a l'équation :

1 (variance totale des positions des espèces)
=
lambda (variance des positions des sites à la moyenne des espèces)
+
(1-lambda) (moyenne des variances des positions des espèces par sites)

et

1 (variance totale des positions des sites)
=
lambda (variance des positions des espèces à la moyenne des sites)
+
(1-lambda) (moyenne des variances des positions des sites par espèce)

lambda est la variance inter-sites du scores espèce (diversité beta)
lambda est la variance inter-espèces du score site (indice de séparation de
niche)
(1-lamda) est la variance intra-sites du score espèce (diversité alpha)
(1-lamda) est la variance intra-espèces du score sites (indice de tolérance)

en gros 1 = diversité alpha + diversité beta = séparation de niches +
tolérance

SI ON VEUT TOUT CELA D'UN SEUL COUP => AFC ET RIEN D'AUTRE
(Voir Thioulouse, J. & Chessel, D. (1992) A method for reciprocal scaling
of species tolerance and sample diversity. Ecology : 73, 670-680. C'est un
bon article, si, si)

Mais Hill (Hill, M.O. (1979) DECORANA-a FORTRAN program for detrended
correspondence analysis and reciprocal averaging. Software documentation.
Cornell University, Ithaca, New-York, USA) a cassé le système avec de
nouvelle coordonnées avec pour les sites
fic.fcl1*sqrt(lambda)/sqrt(1-lambda) variance lambda/(1-lambda)
et pour les espèces
fic.fcc1/sqrt(1-lambda) variance 1/(1-lambda)
The programm uses the convention that site scores are weighted averages of
species scores (Jongman & Coll. p. 103)
qui correspond à l'équation

total inter espèces 1/(1-lambda)
=
inter sites lambda/(1-lambda)
+
intra sites 1

L'algorithm de Ter Braak (two-way weighted averaging algorithm of CA,
ibidem p. 100) donne lui
pour les sites
fic.fcl1 variance 1
pour les colonnes
fic.fcco variance lambda
qui correspond à l'équation

total inter sites 1
=
inter espèces lambda
+
intra espèces (1-lambda)

C'est une question d'échelle. Pour Hill l'unité est la variance intra-site.
Pour calculer la longueur des axes, il faut prendre
[Max(fic.fcli)-Min(fic.fcli)]/sqrt(1-lambda) pour chacun des axes.

Pour retrouver ce résultat prendre la carte Dune où on retrouve les données
centrales de l'ouvrage cité (Jongman, R.H., ter Braak, C.J.F. & van
Tongeren, O.F.R. (1987) Data analysis in community and landscape ecology.
Pudoc, Wageningen. 1-298.)
Faire l'AFC de DuneVeg
Total inertia: 2.11099
-----------------------
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +5.3200E-01 +0.2520 +0.2520 |02 +3.9565E-01 +0.1874 +0.4394 |
03 +2.4652E-01 +0.1168 +0.5562 |04 +1.7059E-01 +0.0808 +0.6370 |

Les espèces sont dans ce fichier les lignes et les relevés les colonnes :

File E:\Ade4\INRALOCI\DuneVeg.fcco contains the column scores
--- It has 20 rows and 2 columns
File :E:\Ade4\INRALOCI\DuneVeg.fcco
|Col.| Mini | Maxi |
|----|----------|----------|
| 1|-1.449e+00| 1.130e+00|
| 2|-7.303e-01| 2.094e+00|
|----|----------|----------|

(1.130-(-1.449))/sqrt(1-0.532)=2.579/0.6841=3.77
Cela signifie (environ 4) que les relevés aux deux bouts du gradient n'ont
plus d'espèces en commun.
Cette discussion un peu technique montre que les modifications introduites
par Hill et la discussion reprise par Ter Braak ne garde pas la symétrie.
Veut-on séparer les sites par les espèces qu'ils contiennent (Hill, voir CA
ordination diagram of the Dune meadow Data in Hill's scaling p. 102) ou les
espèces par les sites où on les trouve (ce qui donne la CA et la CCA où les
espèces ont des positions moyennes sur les scores des sites) ou veut-on les
deux à la fois ?

C'est cette question qui détermine la méthode à utiliser. Les analyses non
symétriques (PCA: After row % transformation PCA, COA: NSCA_Row_Profiles,
COA: NSCA_Col_Profiles, Niche: Species Profiles PCA) pour un tableau sont
en général plus simples, sans "arch effect". Mais il faut dire dans quel
sens on travaille (regarder PCA: After row % transformation sur DuneVeg et
son transposé, ce sont deux analyses très différentes). Avec des variables
de milieu Niche: OMI Analysis fonctionne aussi bien sur des problèmes de
séparation de niches (comme la CCA) que sur des réponses linéaires aux
gradients (comme la RDA).

Cordialement

Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77 - (33) 4 72 44 82 77



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:03 MET