Le_pb_de_F._Spinazzi

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Thu Nov 06 1997 - 15:00:45 MET


Bonjour,

Federico Spinazzi est le premier à envoyer des données pour la discussion. Je trouve que c'est une bonne idée. Il vaut mieux les mettre dans le message. C'était du binaire pour PC. AdeTrans en fait du texte que je récupère sur mac pour en faire du binaire Mac.

C'est un cas d'école très intéressant.

Deux variables explicatives forment le tableau ca_delta

-0.699 2.636
-0.678 2.549
0.286 0.128
0.076 1.418
-0.921 2.545
-0.921 2.314
-0.337 0.802
-0.444 1.433
-0.268 0.223
-0.06 -0.057
-0.032 -0.288
-0.387 0.896
-0.367 0.843
-0.319 0.73
0.061 -0.223
-0.027 -0.065
-0.022 0.128
0.193 0.431
0 -0.238
0.021 -0.178
0.654 -1.07
0.966 -1.498
0.27 0.034
0.952 -0.711
0.971 -1.101
0.752 -0.59
0.717 -0.091
0.555 -1.059
-0.056 0.518
-0.18 0.336
-0.208 0.208
0.924 -0.586
0.688 -0.779
0.908 -0.847
0.993 -1.01
0.967 -1.006
0.806 -0.931
0.697 -0.552
0.711 -0.03
1.067 -0.503
0.775 -0.28
0.647 -0.768
0.32 -0.798
0.25 -0.159
0.4 -0.605
0.38 -0.288
0.29 -0.62
0.59 -1.07
-0.2 -0.167

On a sur ces 49 échantillons la composition en 11 minéraux dans tab_2 :

13 0 0 4 5 0 0 7 0 0 1
5 0 0 2 2 0 2 17 0 0 2
13 1 0 5 4 0 1 5 0 0 1
10 1 0 0 5 1 0 8 0 0 5
12 1 3 7 3 0 1 1 0 0 2
12 0 2 1 2 0 3 2 1 0 6
9 0 1 4 6 0 1 2 0 0 4
14 0 1 5 2 0 1 2 0 0 4
10 3 4 6 1 0 2 2 0 0 2
11 2 1 4 3 0 1 4 0 0 4
9 1 0 4 4 0 0 3 0 0 9
5 0 0 3 6 1 2 13 0 0 0
13 0 0 5 2 0 2 4 0 0 4
1 2 1 16 0 1 1 2 1 2 2
13 0 1 7 2 0 0 4 0 0 3
18 0 1 4 0 0 1 0 0 0 4
9 1 1 14 11 0 2 0 5 0 6
2 0 0 18 4 0 5 0 3 0 2
2 0 2 6 3 1 5 1 7 1 2
2 0 2 5 3 0 8 1 0 2 6
3 2 3 13 6 2 8 3 7 8 5
2 1 2 10 2 1 4 0 8 11 8
2 0 2 14 5 1 5 1 3 8 9
23 2 2 6 6 1 3 2 0 0 5
4 0 3 4 7 0 5 2 0 20 6
3 2 3 7 2 0 9 1 4 12 8
29 0 0 1 1 0 1 0 0 0 20
11 1 1 1 2 0 5 1 0 17 11
5 2 2 1 5 0 11 2 0 2 4
13 0 5 2 3 0 1 2 1 0 2
12 2 1 10 1 0 0 2 0 0 2
14 1 1 5 3 0 1 0 0 0 5
10 0 1 12 3 0 0 0 0 0 4
15 0 1 3 4 0 1 0 22 0 4
20 0 0 0 5 0 1 0 23 0 3
14 0 0 2 3 0 0 1 19 0 10
10 0 0 2 7 0 0 0 23 0 8
12 0 1 6 9 0 1 1 12 1 6
5 2 2 5 7 0 5 0 1 17 7
3 1 1 2 8 0 4 0 6 16 9
2 1 8 4 3 1 4 2 3 5 18
0 3 3 1 3 0 9 1 6 11 14
15 0 2 1 4 0 0 0 18 0 9
14 1 0 1 7 0 1 0 21 0 5
14 2 2 5 6 0 0 1 9 0 9
11 0 1 2 11 0 0 0 21 0 3
7 1 2 2 3 0 0 1 20 0 4
10 0 1 1 5 0 1 1 25 0 6
11 1 2 2 5 1 0 0 19 0 8

Comment être sûr qu'il existe un lien entre ces deux tableaux.

PCA : Correlation matrix PCA sur ca_delta
La corrélation entre ces deux variables est forte (-0.857)

PCA : Covariance matrix PCA sur tab_2
La structure est forte et on garde trois facteurs :
Total inertia: 194.497
-----------------------
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +7.8317E+01 +0.4027 +0.4027 |02 +4.9024E+01 +0.2521 +0.6547 |
03 +2.7220E+01 +0.1399 +0.7947 |04 +1.5523E+01 +0.0798 +0.8745 |
05 +9.5174E+00 +0.0489 +0.9234 |06 +5.3078E+00 +0.0273 +0.9507 |
07 +4.3876E+00 +0.0226 +0.9733 |08 +2.9541E+00 +0.0152 +0.9884 |

CoInertia : Matching two statistical triplets
First input file ca_delta.cnta
Second input file tab_2.cpta
Output file name : A

CoInertia : Coinertia test - Fixed D
number of random permutations: 10000 Observed: 4.789e+01
Histogram: minimum = 5.525e-01, maximum = 4.789e+01
number of simulations X<Obs: 10000 (frequency: 1.000e+00)
number of simulations X>=Obs: 0 (frequency: 0.000e+00)

   |****************
   |**************************************************
   |***********************************************
   |********************************
   |********************
   |************
   |*******
   |****
   |**
   |*
   |*
   |
   |
   |
   |
   |
   |
   |
   |
*->|

Il y a un lien très fort entre les deux tableaux.

CoInertia : Coinertia analysis sur A.iita

Il y a un axe de co-inertie :
Num. Eigenval. R.Iner. R.Sum |Num. Eigenval. R.Iner. R.Sum |
01 +4.7315E+01 +0.9881 +0.9881 |02 +5.7046E-01 +0.0119 +1.0000 |

-----------------------------------------------------------------
|Num| Covaria.| Varian1 | varian2 | Correla.| INER1 | INER2 |
-----------------------------------------------------------------
| 1| 6.879| 1.857| 53.89| 0.6876| 1.857| 78.32|
-----------------------------------------------------------------

Voir le fichier A.iia1
  0.9999
 -0.0109

L'axe 1 de co-inertie du premier tableau est l'axe 1 de l'ACP de ce tableau

Voir le fichier A.iia2
 -0.5869
  0.6754
 -0.3581

L'axe 1 de co-inertie du second tableau est la bissectrice entre les axes 1 et 2 de l'ACP de ce tableau.

Si on revient sur les corrélations entre coordonnées des analyses de base, on trouve :
corr (f1-f1) = -0.33
corr (f1-f2) = 0.49
corr (f1-f3) = -.35

La question est :
Pourquoi tout est-il corrélé avec tout ? Est-ce habituel ? Que se cache't-il derrière ?

Comme souvent dans les données écologiques le plus important n'est pas dans les données
Il s'agit d'une carotte glacière. Je suppose que les échantillons sont des portions de cette carotte et que derrière les données, il y a le temps.
Effectivement, importé dans S-PLUS, on voit qu'il y a beaucoup de fonctions d'autocorrélation significatives à une ou plusieurs échelles.

Avec Curves sur le numéro de lignes et les tableaux de données, on verra qu'il s'agit de processus avec des tendances et des périodes marquées. L'analyse du tableau tab_2 met en évidence dans le plan 1-2 trois grandes périodes tandis que les deux variables environnementales ont des évolutions fortes. On est en fait sur un couplage multi-échelle entre deux processus multivariés.

On a de ce couplage une idée déjà forte par une analyse simple mais l'omniprésence de l'autocorrélation ne peut être ignorée.

Voir Solow, A.R. (1994) Detecting change in the composition of a multispecies community. Biometrics : 50, 556-565.
Van Hulst, R. (1978) On the dynamics of vegetation: patterns of environmental and vegetational change. Vegetatio : 38, 65-75.
Di Bella, G. & Jona-Lasinio, G. (1996) Including spatial contiguity information in the analysis of multispecific patterns. Environmental and Ecological Statistics : 3, 269-280.
Thioulouse, J., Chessel, D. & Champely, S. (1995) Multivariate analysis of spatial patterns: a unified approach to local and global structures. Environmental and Ecological Statistics : 2, 1-14.

En tout cas un joli problème qui peut inspirer des statisticiens professionnels

Cordialement

>Bonjour,
>
>I have a table of integer number > 0.
>It is like a site-species table. Then I have one or two variable (we can
>consider them as enviromental variables).
>
>I have the strong doubt that I can ALWAYS obtain a 'good' (say about 0.6)
>correlation between any (the first one or the second one or the third one
>or...) of the principal component of such a table and the 'enviromental
>variables'. There must be a way to test this hipothesis via a Monte Carlo
>tests with ADE-4, but I really don't succeed in concentrating myself on
>this
>problem.
>
>Help !
>
>I post the data.
>
> tab_2 is the table;
>
> ca_delta is the file containing the two 'env. vars';
>
> they come from an ice core, made in Greenland under the GRIP Ice
> Core Project of the European Science Foundation.
>
> The table contains the abundance of 11 mineralogical species along
> the core.
>
> The vars are two paleoclimatic record: log(Ca++) and d18O.
>
>Thank you.
>
>
>Content-Type: APPLICATION/octet-stream; name=tab_2
>Content-ID: <Pine.LNX.3.93.971106083353.5364B@SysPr03.disat.unimi.it>
>Content-Description:
>
>Annexe convertie: 1-SysCom:tab_2 (????/----) (00013C31)
>Content-Type: APPLICATION/octet-stream; name=ca_delta
>Content-ID: <Pine.LNX.3.93.971106083353.5364C@SysPr03.disat.unimi.it>
>Content-Description:
>
>Annexe convertie: 1-SysCom:ca_delta (????/----) (00013C32)

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
ADE-4 sur Internet ---> http://biomserv.univ-lyon1.fr/ADE-4.html
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:39 MET