MANOVA_non_paramÈtrique

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Dec 18 1998 - 08:57:48 MET


Nous n'avons pas prévu de programmer la MANOVA mais la question posée n'est pas sans intérêt et permet quelques commentaires.

Comme nous faisons actuellement l'introduction de S-PLUS au DEA de notre formation doctorale je suis allé voir dans S-PLUS si il y avait une commande manova. Réponse oui (c'est toujours oui). Question qu'est-ce-que c'est ? Réponse p. 431 du "Guide to Statistics" avec trois bouquins cités. Je vais voir la définition dans la bible (Sokal, R.R. & Rohlf, F.J. (1969) Biometry. Third edition. W.H. Freeman and Company, New-York. 850 p.). Réponse, ça existe et c'est tout p. 680. Je vais voir dans un bouquin sérieux (Seber, G.A.F. (1984) Multivariate observations. Wiley, New-York. 685 p.)

1) C'est une analyse de variance dans laquelle la réponse est gaussienne multivariée. Il y a un petit jeu de données Table 9.3 p. 436. manova() de S-PLUS donne 4 tests statistiques WILKS (p=0.60), PILLAI (p=0.54), ROY (p=0.41) et HOTELLING (p=0.67). Deux des 4 sont donnés par Seber. Les 4 sont décrits par Tomassone, R., Danzard, M., Daudin, J.J. & Masson, J.P. (1988) Discrimination et classement. Masson, Paris. 1-173. p. 156.
Seber (p.443) a un paragraphe 9.2.4 "Robust tests for Equal Means", a) Permutation Test de Mardia (1971) qui donne une approximation analytique (cité aussi dans Kazi-Aoual, F., Hitier, S., Sabatier, R. & Lebreton, J.D. (1995) Refined approximations to permutation tests for multivariate inference. Computational Statistics and Data Analysis : 20, 643-656.). Dans ADE-4, l'option Discrimin: Discriminant analysis/Test donne la version simulation. Sur 1000 simulations on trouve p=0.43. On est bien d'accord. MANOVA pour un facteur et une réponse multivariée est bien l'analyse discriminante après PCA: Correlation matrix PCA. ADE-4 ne donne pas les tests classiques mais une approximation acceptable (Cf. Potvin, C. & Roff, D.A. (1993) Distribution-free and robust statistical methods: viable alternatives to parametric statistics?. Ecology : 74, 1617-1628). Dans ADE-4 cette stratégie est utilisable pour tous types de variables dans la réponse.

2) Extensions. Dans Seber il y a ensuite l'extension aux plans d'expériences en blocs randomisés (je passe) puis l'extension de l'analyse de covariance (plusieurs explicatives, qualitatives et quantitatives) et un jeu de données plus conséquent p. 469. Tableau X deux explicatives quantitatives et un facteur. Tableau Y : 11 variables quantitatives. Seber donne trois tests H01 (les moyennes par classes sur le facteur sont égales, a1=a2=a3=0), H02 (la première explicative quantitative n'a pas d'effet g1=0) et H03 (g2=0).Je me demande alors si la MANOVA avec plusieurs explicatives donne des tests emboités comme l'ANOVA (effet 1, + effet 2, + effet 3, residuelle). Je tape le tableau et manova() dans S-PLUS. Les tests sont séparés comme dans Seber. Avec summary() on a les 4 séries de tests cités pour chacun des facteurs mais avec predict() on a un modèle du tableau Y avec l'utilisation de tous les facteurs. Donc on a l'équivalent dans ADE-4, avec :
a) PCA: Correlation matrix PCA sur le tableau Y
b) pour le facteur CategVar: Read Categ File, Projectors: One Categ Var->Orthonormal Basis et le test non paramétrique par Projectors: Subspace Test équivalent de Discrimin: Discriminant analysis/Test.
c) pour une explicative quantitative mettre la variable x normalisée dans un fichier (Bin->Bin: Centring), définir un sous-espace de projection de dimension 1 (Projectors: Table->Orthonormal Basis) et faire le test de permutations (Projectors: Subspace Test)
d) pour avoir le modèle additif le plus simple est de faire comme dans Seber (p.468) Faire un tableau d'explicatives avec une colonne de 1 (E(Y) = mu + ...), ensuite les qualitatives en faisant sauter l'indicatrice de la dernière modalité (ou l'indicatrice de la modalité témoin, c'est encore plus joli mais il faut connaître la notion de contrastes CategVar: Categ->Disj et FilesUtil: Row-Col Selection), puis les explicatives (sans les normaliser) Projectors: Table->Orthonormal Basis et Projectors: Table Projection donne le modèle et les coefficients en clair rapportés aux variables de départ.

3) Si on a un problème de ce type avec un plan d'expérience, d'un point de vue professionnel, l'usage d'un logiciel de statistiques inférentielles s'impose. On peut en bricolant avoir des équivalents dans ADE-4, mais c'est tiré par les cheveux. Remarque : dans S-PLUS on a l'ordre summary(x, univariate=T) où x est une manova qui est l'équivalent dans ADE-4 de Discrimin: Anova1-FF quand les explicatives sont toutes qualitatives. Par contre, si le tableau Y est un tableau floro-faunistique avec 500 relevés et 200 espèces après une ordination au choix comme HTA: Double centring additive ou les COA, l'emploi d'ADE-4 est justifié (il n'y a pas d'alternatives, la non-normalité étant la règle).

P.S. Dans l'équipe il y en a un qui ne mange que des yaourts mais les autres préfèrent le whisky (single malt, c'est mieux)

Cordialement

>Bonjour,
>
>Avez-vous prevu de programmer la MANOVA dans le logiciel (en tant
>qu'extension de l'analyse factorielle discriminante lorsque plusieurs
>variables qualitatives décrivent les lignes) ?
>Sinon, existe-t-il un moyen de la réaliser, via le module de régression et
>un codage des variables qualitatives ?
>
>Merci de vos réponse
>
>A bientôt,
>
>Romain JOCTEUR MONROZIER
>
>+-------------------------------------+
>| Romain JOCTEUR MONROZIER |
>| groupe DANONE |
>| centre de recherche TEPRAL |
>| 68, route d'Oberhausbergen |
>| 67037 STRASBOURG Cedex |
>| rmonrozier@tepral.fr |
>| (00-33)3-88-27-40-28 |
>+-------------------------------------+

Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:22:04 MET