Re: Tests_inter_classes

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Mar 13 1998 - 06:42:30 MET


recyval@wanadoo.fr pose une question simple :

p variables sont mesurées sur n individus réparties en k classes.
On a un fichier X (n lignes et p colonnes) et un fichier cla qui contient
les numéros des classes (n lignes et 1 colonne) lu par CategVar : Read
Categ File quidonne le cla.cat.

Les analyses de variance standard de chacune des variables de X sur les
classes de cla sont données par Discrimin : Anova1-FF dans la forme
standard. On peut avoir la même information réduite dans StatUtil :
R2-Anova1-FF.

Les tests globaux multivariés sont des tests de randomisation. On a le
choix entre
Discrimin : Discriminant analysis/Test
Doc du module :
L'option est un exemple de tests de permutation dont la synthèse a été
assurée pour les biologistes par Manly, B.F.J. (1991) Randomization and
Monte Carlo methods in biology. Chapman and Hall, London. 1-281. Le test
présenté ici est équivalent au T2 de Hotteling étendu à tous les types de
variables et à un nombre quelconque de classes. On calcule, pour chaque
répartition aléatoire des individus dans les groupes, l'inertie interclasse
totale avec la métrique de Mahalanobis, au sens de l'inverse généralisé de
l'opérateur d'inertie totale de la matrice de départ. Une valeur
significativement grande indique une ressemblance globalement plus forte
entre individus d'une même classe et justifie la description des
différences par l'analyse discriminante.

et
Discrimin : Between analysis/Test
Doc du module :
D'après le chapitre 10 de l'ouvrage de Manly, le test présenté ici est
équivalent au test de Romesburg, H.C. (1985) Exploring, confirming and
randomization tests. Computers and Geosciences : 11, 19-37 étendu à tous
les types de variables. On calcule, pour chaque répartition aléatoire des
individus dans les groupes, l'inertie interclasse totale alors que
Romesburg (dans le cadre d'une ACP) calcule l'inertie intraclasse. Que la
première soit significativement grande équivaut à ce que la seconde soit
significativement petite, la somme des deux étant constante.

Les deux versions différent par la métrique utilisée pour caclculer les
distances (Mahalanobis ou canonique).

Quelques ouvrages de base pour comprendre les principes sous-jacents
anova :
Dagnelie, P. (1975) Théories et méthodes statistiques : Analyse statistique
à plusieurs variables, Tome 2. Les presses agronomiques de Gembloux,
Gembloux. 1-362.
discriminante :
Tomassone, R., Danzard, M., Daudin, J.J. & Masson, J.P. (1988)
Discrimination et classement. Masson, Paris. 1-173.
Manly, B.F. (1994a) Multivariate Statistical Methods. A primer. Second
edition. Chapman & Hall, London. 1-215.
tests de permutation
Edgington, E.S. (1995) Randomization tests. Marcel Dekker, Inc., New York.
1-409.
Manly, B.F.J. (1991) Randomization and Monte Carlo methods in biology.
Chapman and Hall, London. 1-281.

>Je travail sur des données d'analyses de boues de stations d'épuration de
>différents types.
>J'aimerais tester la significativité des différences observées entre groupes
>pour chacune de mes variables (ex: test de fisher sur les moyennes). Comment
>dois-je m'y prendre avec ADE4?

>J'aimerais savoir quel est le principe du test dans Discrimin : Discriminant
>analysis/test pour mieux en comprendre le résultat.

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:52 MET