Re: NSCA, ACOM, etc...

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Sep 28 1999 - 09:11:40 MET DST


Emmanuel Castella pose quelques questions de natures diverses. Voici
quelques réponses diverses.

>1) J'ai du mal à comprendre l'utilisation pouvant être faite des indices
>Catanova et r2 en NSCA. Sont-ils sensés apporter une information
>différente?. Ayant appliqué cette méthode (profils lignes) à 5 tableaux
>faunistiques (mêmes stations en lignes mais 5 groupes taxonomiques
>différents en colonnes), j'ai remarqué que catanova et r2 évoluaient en
>sens inverse. Est-ce normal?

L'indice Catanova est réservé à l'utilisation de vraies tables de
contingences, ce qui n'est jamais le cas des tableaux faunistiques, soit
parce qu'ils ne contiennent pas des dénombrements (note d'abondance,
classes de recouvrement, présence-absence) soit à cause de l'aggrégativité
des organismes (non indépendance des réplicats). De manière générale, en
AFC, tout ce qui touche à la notion de table de contingence comme le test
du Khi2 ou sa version de Monte-Carlo dans COA: Total inertia test ne
s'appliquent pas à des tableaux faunistiques. Ceci s'étend à la NSCA. Dans
Gimaret-Carpentier, C., Chessel, D. & Pascal, J.P. (1998) Non-symmetric
correspondence analysis: an alternative for community analysis with species
occurrences data. Plant Ecology : 138, 97-112, on pouvait en parler car le
tableau contient des effectifs d'occurrences d'arbes par espèce et par
quadrats prélevées dans le herbiers du monde entier : il s'agit d'une vraie
table de contingence.

>2) Je cherche à me procurer l'article de Lauro et D'Ambra (1984)
>présentant la NSCA. La bibliothèque centrale suisse, d'ordinaire
>incollable, ne semble pas posséder Diday & al (eds). Data analysis and
>informatics 3. Elsevier. Un collectionneur généreux pourrait-il aller
>jusqu'à m'expédier une copie des quelques pages de cet article ??

La lecture de l'article de Lauro et D'ambra n'est pas recommandé pour un
point de vue utilisateur : son intérêt est très théorique et l'illustration
numérique contient des erreurs. Mais il contient l'idée que si une AFC est
une analyse canonique, il existe deux ACPVI qui sont les analyse non
symétriques des correspondances. Ceci est explicité en détail dans Thema28.
Emmanuel, je t'envoie une copie de l'article d'origine.

>3) En ACOM il n'existe pas (comme dans la Co-inertie) de valeurs propres
>associées à la co-structure, ni de test de celle-ci. Ai-je mal vu? La
>question a-t'elle un sens?

Il n'existe pas de valeurs propres, ou plutôt il en existe une à chaque
niveau (l'algorithme est une analyse factorielle multiple d'ordre 1 dans
une boucle). Pour le test, je me suis posé la question, mais on bute sur
l'hypothèse nulle et de manière générale il n'y a pas de tests associés au
K-tableaux. On pourrait permuter les lignes d'un tableau (cela ferait K
tests) ou toutes les lignes de tous les tableaux mais un K-tableau sans
structure c'est difficilement concevable. J'ai essayé dans S-PLUS le
bootstrap sur une différence de RV pour tester si le lien entre X et Z est
plus fort que le lien entre Y et Z. ça marche bien parce que c'est une
problème précis. En K-tableaux des tests généralistes n'ont guère de sens.

>4) Que font respectivement les options "among-group-distance" et
>"assignment" du module Discrimin, ainsi que "Monte-Carlo" du module
>"Scatter"? Y-a-t'il des exemples de leur utilisation dans la
>documentation?

L'option Discrimin: Among_group_distances calcule les distances de
Mahalanobis classiques entre sous-populations. Voir la doc et l'ouvrage
classique cité de Manly. L'option Discrimin: Assignment_New et Old donnent
des outils pour réaffecter les individus à la classe la plus proche (permet
de calculer le pourcentage des bien classés, aide classique en analyse
discriminante) et d'estimer la classe d'appartenance de nouveaux individus.
Voir la doc et Manly 1994. Très utile en biomédical pour faire du
diagnostic automatique sur des mesures multivariées. Il n'y a pas d'exemple
car les données médicales sont soumises à des règles de discrétion aisément
compréhensibles.

Quant à Scatters: Monte Carlo voir un précédent message sur cette option
fantôme :

http://pbil.univ-lyon1.fr/ADE-4/adelisthtml/0305.html

Cordialement
Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX
Tel : 04 72 44 82 77



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:36:01 MET