Agustin Lobo pose deux questions fort interessantes et la réponse n'est pas
simple.
>I'm using COA to compare the result of the classification of a
>multi-temporal satellite image to
>a set of 7 landcover maps of the Mediterranean Basin.
>I have produced 7 contingency matrices and run COA on
>each one.
>
>I have a couple of questions.
>
>1. Can I use the value of the first eigenvalue as
>a measure of correpondence? Note that although
>the contingency matrix has always the same number of rows
>(because I'm always using the same classification), the number
>of columns is different for each COA as the different landcover
>maps have different legends with different number of
>categories. Is there any way to take the number of columns
>into account at evaluating the first eigenvalue?
>I would say that I could use the ratio between the first observed
>eigenvalue to the average eigenvalue from the permutation
>test, would this be correct?
>Or should I just use a Chi sq. coefficient?
La première valeur propre lambda1 est une bonne mesure du lien.
Le Chi2 est une bonne mesure du lien. On utilise aussi Phi2 = Chi2/n
où n est la somme totale de toutes les cases du tableau.
On a
Phi2 = Chi2/n = lamda1 + lambda2 + ... + lambdak
lamda1 est le carré de la corrélation canonique et sqrt(lambda1) est aussi
une bonne mesure du lien
Dans Kendall, D.G. & Stuart, A. (1961) The advanced theory of statistics.
Vol 2: Inference and relationships. Cha. 33 : Categorized data. Griffin,
London. 536-591 on trouve que
n*lambda1 peut être considéré comme un Chi2 à (r-1)*(c-1) DDL (=DF) avec r
le nombre de lignes et c le nombre de colonnes. Mais dans Lebart, L.,
Morineau, A. & Piron, M. (1995) Statistique exploratoire
multidimensionnelle. Dunod, Paris. 1-439 (p. 362) on trouve que Lancaster
H.O. (1963) Canonical correlation and partition of Chi2. Quat. J. Math.,
14, 220-224 a montré que ce résultat n'est pas bon.
On peut aussi utiliser le T2 de Tchuprov (Dans Kendall & Stuart 1961) avec
T2 = Chi2/[n*sqrt(r-1)*sqrt(c-1)] = Phi2/[sqrt(r-1)*sqrt(c-1)]
(cité dans Cailliez, F. & Pages, J.P. (1976) Introduction à l'analyse des
données. SMASH, 9 rue Duban, 75016 Paris. 1-616. p. 486)
Le T2 est compris entre 0 et 1 comme sqrt(lambda1) et permet de comparer
des tables à nombres de colonnes différentes.
>2. If I plot the positions of rows and columns in the COA space
>(i.e., the plane defined by the first two axes),
>can the euclidean distances in the
>COA space between a given row and a given column
>be used as a measure of linkage? I think that there are some
>problems with this practice.
Cette question renvoie à une propriété peu connue mais très spectaculaire
de l'AFC dans Heiser, W.J. (1987) Joint ordination of species ans sites:
the unfolding technique. In : Developments in numerical ecology. Legendre,
L. & Legendre, P. (Eds.) Springer-Verlag, Berlin, Ecological Sciences, Vol.
14. 189-221.
Fondamentalement, si on veut placer les lignes et les colonnes sur un axe
par des coordonnées xi et yj (de moyenne nulle et de variance unité) de
manière à ce que (fij est la fréquence de la case ij)
Sumi(Sumj(fijd2(xi,yj))) soit MINIMALE il faut faire l'AFC. Le minimum est
2*(1-lambda1)
On peut donc mesurer le lien entre la ligne i et la colonne j par la
distance euclidienne (par exemple sur la carte factorielle) ou par
fijd2(xi,yj). Cette pratique est très originale et il faudrait peut-être
voir la thèse de l'auteur (Heiser, W.J. (1981) Unfolding analysis of of
proximity data. Ph. D., University of Leiden, The Netherlands).
Cela pourrait faire l'objet d'un développement dans ADE-4. A suivre ?
Cordialement
Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:02 MET