Bonjour,
Le problème que je rencontre rappelle celui deja soulevé par Olivier
Raymond, a propos de l'AFM et de mélanges de variables quantitatives et
qualitatives. Je pense toutefois qu'il se pose différemment dans mon cas.
Je désire confronter les informations fournies par différentes approches
(morphométriques et génétiques) concernant la structuration géographique de
31 populations d'escargots (personne n'est parfait). Trois types de
tableaux sont constitués:
(i) des variables morphométriques de la coquille (COQ) [5 var],
(ii) des variables morphométriques des genitalia (GEN) [9 var] et
(iii) des fréquences alléliques sur un jeu de 14 locus enzymatiques (ALL)
[74 allèles].
Les tableaux morphométriques sont des moyennes par population de variables
doublement centrées pour éliminer l'effet de taille. Le tableau des
fréquences alléliques est traité comme un tableau d'ACM floue.
Du point de vue d'une analyse K-tableaux, on dispose de 1 + 1 + 14 tableaux
juxtaposés.
Le problème est que je voudrais donner la même importance dans l'analyse à
chacune des 3 approches. Or dans l'optique K-tableaux, le tableau d'ACM est
traité comme autant de tableaux que de variables qualitatives (ici 14
locus) (je n'ai pas vu d'autre façon de procéder). Dans ce cas le résultat
de l'AFM (ou de l'ACOM) est fortement influencé par les 14 tableaux de
l'ACM : le graphe de l'AFM ressemble furieusement à celui de l'ACM seule.
Pour contourner cela, j'ai modifié la pondération contenue dans le fichier
KTPL en divisant le poids de chaque modalité qualitative par 14, puis
réalisé une AFM avec pondération uniforme pour préserver la pondération
précédente.
Résumé des opérations effectuées sous ADE :
1. Traitement du tableau d'ACM floue
ReadFuzzyVar, AFC floue -> tableau centré AFC (FLTA)
2. ACP normée de COQ et GEN -> tableau centré réduit (CPTA)
3. Transposition des tableaux et concaténation
4. Préparation du K-tableaux -> InitKtab (KTP) -> CentringKtab (KTTA)
5. Analyses séparées : une analyse (diagonalisation) par tableau
6. On récupère le fichier .KTPL contenant le poids de chaque variable :
· 0.2 pour COQ,
· 0.111 pour GEN,
· pour ALL : un poids proportionnel au poids de chaque variable dans l'ACM
mais dont la somme pour les 74 allèles soit de 1.
7. AFM sur KTTA avec option : poids uniformes pour conserver la pondération
opérée en 6
8. Projection des colonnes (populations) dans le plan factoriel
Le résultat obtenu n'est pas satisfaisant : l'inertie projetée de chacun
des 14 tableaux d'ACM est très faible et la projection des individus "vus"
par chacun de ces tableaux s'effectue près de l'origine, d'où une image
très confuse.
Je reviens a la question centrale : existe-t-il un moyen de traiter un
tableau d'ACM (groupant plusieurs variables qualitatives) comme un seul
tableau dans une analyse K-tableaux. J'envisage pour l'instant trois
solutions : (i) utiliser les premiers facteurs de l'ACM comme variables
synthétiques à associer aux tableaux biométriques, (ii) utiliser les
distances génétiques de Nei entre les populations, réaliser un cadrage
multidimensionnel non métrique dans un espace à trois ou quatre dimensions,
récupérer ces coordonnées et les traiter comme en (i), (iii) utiliser une
pondération "normale" (inertie identique pour les 16 tableaux) et projeter
la position du tableau ALL comme barycentre des 14 tableaux qu'il contient.
Est-ce que ces solutions sont envisageables, sinon que faire (c'est
l'angoisse) ?
Merci d'avance
Alain Bellido
PS : Félicitations à l'équipe d'ADE pour le travail colossal réalisé
(programmes et documentation).
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:01 MET