**************************************************************** Volume 1 ADE User's Guide 1-1 ADE QuickStart This volume is an introductory description of the ADE-4 package installation and basic use. A short description of the function of computation and graphic modules is also given. The appendices describe the compatibility of ADE with Mac computers as well as current startup error messages. Rev. 95-04. 29 pages. 1-2 HyperCard user interface This volume initiates the user to the ADE HyperCard interface. A catalog of all possible manipulations is described. The HyperCard user interface should be used in the case of intensive data analyses. Rev. 95-04. 34 pages. 1- 3 Starting ADE with the user interface This volume initiates the user to the basic manipulations of ADE program library and its HyperCard interface. The interest of the ADE interface relies on its capacity to enable the simultaneous management of the data sets and modules archives. Rev. 95-04. 22 pages. **************************************************************** Volume 2 Starting Ordination 2-1 Introduction to Linear Data Analysis This volume describes the main features of the mathematical model associated with the linear multivariate methods incorporated into ADE-4 software. The main characteristics of statistical computation for one-table analysis are incorporated. ADE-4 is a data analysis package designed for descriptive statistics, which is useful for large data sets to investigate the structure or the organisation of data. Several illustrations of that volume are part of papers from Chessel & Thioulouse (1990), Thioulouse et al. (1991), Dolédec & Chessel (1991), and Chevenet et al. (1994). Rev. 95-02. 31 pages. 2-2 Principal components analysis This volume describes the computation and usual graphical display of a normalised principal components analysis (PCA) processed on physical and chemical data (Carrel et al., 1986). Alternative computation and graphical representations (canonical graphs, cartography of scores, data reconstitution) also are presented. Rev. 95-02. 36 pages. 2-3 Correspondence analysis This volume describes the computation and usual graphical display of a correspondence analysis processed on bird count data. Rev. 95-02. 18 pages. 2-4 Multiple correspondence analysis This is an introduction to the analysis of tables containing categorical (qualitative) data. In this case, values are represented by modalities. These modalities can be ordered resulting in an ordinal coding. In this volume we perform a multiple correspondence analysis on a data set dealing with cat's fecundity (Pontier, 1984). Rev. 95-02. 14 pages. 2-5 Fuzzy correspondence analysis The paper deals with the multiple correspondence analysis extended to fuzzy coded disjunctive arrays. The example concerns aquatic Coleoptera species and was treated in the paper by Chevenet et al. (1994). Rev. 95-02. 20 pages. 2-6 Between- and within-groups principal components analyses In this volume, the statistical analysis of a multivariate environmental array is described. Quantitative variables collected at s locations for t sampling dates are analysed. To have a distinct view of the respective influence of the seasonal succession and the sample location on the variability of the measures, principal components analyses were used on tables from the linear model of variance analysis in a two-way layout with one observation per cell (Dolédec & Chessel, 1987). Moreover, this volume introduces to the use of multivariate techniques using projection onto a subspace. Rev. 95-02. 27 pages. **************************************************************** Fascicule 3 Ordination Spatiale 3-1 Grilles de mesures La fiche décrit le mode d'emploi des modules de traitement d'une grille de mesure. Elle suit une consultation de C. Julliot. On décrit les fonctions de modules anciens en QuickBasic (LatticePrep) et en Fortran (GNDEN) et de nouveaux ouils graphiques (Maps pour la cartographie par valeurs, Levels pour la cartographie par courbes de niveaux). Rev. 95-03. 27 pages. 3-2 Autocorrélation Spatiale Multidimensionnelle La fiche donne quelques illustrations des notions de variance locale et d'autocorrélation spatiale rendues cohérentes par l'usage d'une pondération adéquate des données (Faraj, A., 1993 - Analyse de contiguité: une analyse discriminante généralisée à plusieurs variables qualitatives. Revue de Statistique Appliquée : 41, 73-84). La théorie est précisée dans Thioulouse, J. Chessel, D. & Champely, S., 1995 - Multivariate analysis of spatial patterns: a unified approach to local and global structures. Environmental and Ecological Statistics : 2, 1-14. (http://biomserv.univ-lyon1.fr/ref/titres.html). L'usage des modules de cartographie est décrit (surfacique, par valeurs et par courbes de niveau). L'analyse des correspondances d'un graphe de voisinage de Lebart, L., 1984 - Correspondence analysis of graph structure. Bulletin technique du CESIA, Paris : 2, 1-2, 5-19 est discutée. L'illustration porte sur un jeu de données socio-économiques classique (Geary, R.C., 1954 - The contiguity ratio and statistical mapping. The incorporated Statistician : 5, 3, 115-145). Rev. 95-02. 28 pages. 3-3 Autocorrélation Spatiale Multidimensionnelle La fiche décrit l'usage des analyses d'inertie locale dans plusieurs circonstances. D'un principe relativement simple, cette analyse peut donner des résultats semblables à ceux obtenus d'une analyse simple dans le cas de gradients multivariés. Dans d'autre cas on obtiendra des résultats complètement différents. Ce type d'analyse concentre l'attention sur la variabilité entre individus voisins et se place comme radicalement antinomique à la recherche des composantes cartographiables d'une enquête écologique à relevés régionalisés. Les exemples traités montrent comment structure locale et globale peuvent se superposer ou se mélanger dans une analyse simple. Rev. 95-02. 27 pages. **************************************************************** Fascicule 4 Analyses de co-inertie 4-1 Co-structure de deux analyses en composantes principales La fiche aborde un des aspects du couplage de tableaux, celui du test de l'existence d'une co-structure entre deux tableaux individus-variables dont on a étudié la structure par une analyse en composantes principales. ADE propose un test de permutation sur une analyse de co-inertie basée sur l'analyse inter-batteries de L.R. Tucker (1958 - An inter-battery method of factor analysis. Psychometrika : 23, 2, 111-136) connue aussi comme le premier pas des Partial Least Square regression (Höskuldsson, A., 1988 - PLS regression methods. Journal of Chemometrics : 2, 211-228). Rev. 95-09. 21 pages. 4-2 Profils écologiques et analyse de co-inertie La fiche illustre les calculs de profils écologiques et l'exacte similitude entre AFC des profils écologiques (Romane, F., 1972 - Un exemple d'utilisation de l'analyse factorielle des correspondances en écologie végétale. In : Grundfagen und Methoden in der Pflanzensoziologie. Maarel, E. van der & Tüxen, R. (Eds.) Dr. W. Junk b.v., The Hague. pp. 155-162) et analyse de co-inertie d'un tableau de variables environnementales qualitatives et d'un tableau de végétation en présence-absence. Cette notion est étendue à des données de végétation quantitatives. La co-structure entre une AFC et une ACM est alors la version complète de l'AFC des tableaux de profils écologiques. L'illustration proposée est celle de Mercier, P, Chessel, D. & Dolédec, S., 1992 - Complete correspondence analysis of an ecological profile data table: a central ordination method. Acta ‘cologica : 13, 25-44. Rev. 95-09. 29 pages. 4-3 Couplage d'analyse des correspondances sur codages flous La fiche "Fuzzy correspondence analysis" décrivait les programmes abordant les tableaux de distributions de notes associant individus et variables qualitatives. On fait ici l'analyse de co-inertie de deux tableaux de ce type. L'exemple est tiré de Chevenet, F., Dolédec, S. & Chessel, D., 1994 - A fuzzy coding approach for the analysis of long-term ecological data. Freshwater Biology : 31, 295-309. On trouvera une introduction de l'analyse de co-inertie impliquant une AFC en biologie moléculaire dans Thioulouse, J. & Lobry, J.R., 1995 - Co-inertia analysis of amino-acid physico-chemical properties and protein composition with the ADE package. Computer Applications in the BIOSciences : 11, 321-329 (http://biomserv.univ-lyon1.fr/ref/titres.html). Rev. 95-09. 20 pages. 4-4 Triplet d'analyse des correspondances La fiche décrit une procédure d'analyse à trois tableaux utilisant un tableau d'AFC comme lien entre deux tableaux quelconques. Cette analyse est appelée analyse RLQ (R pour tableau en mode R, Q pour tableau en mode Q, et L tableau du lien) est basée sur les propriétés d'optimisation de la corrélation des scores lignes-colonnes en AFC. Dans l'exemple traité les tableaux R et Q sont des tableaux de variables qualitatives et constituent donc un cas particulier. On trouvera la théorie générale dans Dolédec S., Chessel D., ter Braak C.J.F. & Champely S., 1996, Matching species traits to environmental variables: a new three-table ordination method. Environmental and Ecological Statistics (in press). Rev. 95-10. 63 pages. **NOUVEAU** 4-5 Comparaison de deux tableaux homogènes de tests de toxicité La fiche porte sur la description des tableaux homogènes quantitatifs, en particulier de leur centrage. Le centrage multiplicatif est le plus adapté pour des tableaux homogènes de tests de toxicité. On illustre une analyse de co-inertie entre deux ACP avec un centrage multiplicatif commun aux deux tableaux. On met en évidence, au delà de la similitude apparente, une différence de fond entre résultats de tests in vivo et in vitro, différence systématique exprimée par le biais d'une analyse de co-structure. L'analyse de co-inertie est introduite en chimiométrie dans Devillers, J. & Chessel, D., 1995 - Comparaison of in vivo and in vitro toxicity tests from co-inertia analysis. In : Computer-Aided Molecular Design. Applications in Agrochemicals, Materials and Pharmaceuticals. Reynolds, C.H., Holloway, M.K. & Cox, H.K. (Eds.) ACS Symposium Series 589.American Chemical Society, Washington. 250-266. Rev. 96-02. 23 pages. **************************************************************** Fascicule 5 Variables Instrumentales 5-1 Variables explicatives indépendantes La fiche décrit la régression linéaire dans le cas le plus simple et le plus clair, celui de variables explicatives indépendantes. La première situation abordée est celle d'une variable explicative unique (Module UniVar). On considère ensuite k explicatives indépendantes (Module OrthoVar). La régression sur composantes principales (PCR) et la régression sur vecteurs propres de voisinages (NER) sont de ce type. On souligne que le principe de régression linéaire permet d'aborder des structures qui ne le sont pas du tout comme des courbes de réponses en cloche ou des chroniques auto corrélées négativement. Rev. 95-03. 28 pages. 5-2 Régression linéaire La fiche décrit la régression linéaire (module Projectors, très général et module RegMul, très classique) dans le cadre d'un problème de prédiction d'une variable biologique par des variables d'environnement, problème posé dans un article récent de P. Baran & Coll. (1993, Bull. Fr. Pêche Piscic : 331, 321-340). On accorde une certaine importance à l'examen des variables initiales et à la définition de l'objectif visé. On aborde la régression multiple classique, les difficultés qu'elle soulève, et la solution proposée par la régression PLS, ou régression partiellement aux moindres carrés (inventée en chimiométrie, dont elle est un standard méthodologique). L'algorithme utilisé est décrit par Ter Braak & Juggins (1993, Hydrobiologia : 269/270, 485-502. p. 487). Rev. 95-01. 26 pages. 5-3 Analyses Discriminantes Parmi de nombreuses méthodes de discrimination, l'analyse discriminante linéaire, ou analyse factorielle discriminante est la plus connue. Elle sert essentiellement à décrire ce qui distingue les moyennes par groupe de plusieurs variables mesurées sur plusieurs individus de plusieurs groupes. Si on ne poursuit pas cet objectif, la méthode est sans signification. La fiche décrit l'emploi du module Discrimin. En illustrant un problème de morphométrie avec l'analyse discriminante on remonte aux sources (Mahalanobis, P.C. (1936) On the generalized distance in statistics. Proceedings of the National Institute of Sciences of India : 12, 49-55). Le programme est cependant beaucoup plus général et on l'emploie après une ACP à centrage multiplicatif, ce qui est inhabituel. Rev. 95-02. 26 pages. 5-4 Analyse Canonique des Correspondances L'Analyse Canonique des Correspondances de ter Braak (1986 - Canonical correspondence analysis : a new eigenvector technique for multivariate direct gradient analysis. Ecology : 69, 69-77) est la version ACP/AFC d'une méthode très générale de couplages de tableaux qu'on peut mettre en ¦uvre sur tout type de variables dans le module Projectors. Les illustrations portent sur des relevés avifaunistiques couplés à des relevés d'architecture de la végétation. Rev. 95-04. 36 pages. 5-5 Ordination sous contraintes L'Analyse en Composantes Explicatives (ACE) d'Obadia (1978 - Revue de Statistique Appliquée : 24, 4, 5-28) est la version ACP/ACP d'une méthode très générale de couplages de tableaux qu'on peut mettre en ¦uvre sur tout type de variables dans le module Projectors. La version AFC/ACP est l'Analyse Canonique des Correspondances ou AFCVI ou encore AFC sous contraintes. Diverses illustrations introduisent à la plasticité de ces méthodes et en soulignent les limites. Le module Projectors permet ainsi des analyses sous contraintes variées, en particulier les analyses canoniques des correspondances partielles, les analyses des covariances partielles, LONGI. Toutes les variantes sont exécutables sur variables qualitatives, quantitatives et floues. Rev. 95-05. 40 pages. **************************************************************** Fascicule 6 Méthodes classiques d'ordination simultanée de K tableaux 6-1 STATIS et valeurs typologiques des groupes faunistiques La fiche donne une première présentation de la méthode ACT-STATIS. On aborde le cas d'un multi-tableau formé d'un tableau faunistique et de la répartition des taxons en plusieurs groupes faunistiques. Une mesure de la valeur typologique de chaque groupe est proposée. Rev. 95-04. 29 pages. 6-2 STATIS et ordination de plusieurs ensembles de relevés Sur proposition de leur auteur, les données ichtyologiques publiées dans la thèse de J. Verneaux (1973 - Cours d'eau de Franche-Comté (Massif du Jura). Recherches écologiques sur le réseau hydrographique du Doubs. Essai de biotypologie. Thèse d'état, Besançon. 1-257) sont revisitées avec la méthode STATIS. La comparaison de trois groupes de variables - géomorphologiques, ichtyologiques et physico-chimiques - permet de souligner l'objectif particulier qu'on se donne en utilisant cette méthode multi-tableaux. La fiche donne un moyen d'exécuter STATIS avec des propriétés d'analyse des correspondances par le bias de l'ACM floue. Rev. 95-04. 33 pages. 6-3 L'analyse triadique partielle La fiche décrit le mode d'emploi de l'analyse triadique partielle. La méthode, qu'on peut appeler STATIS sur les tableaux, par opposition à STATIS sur les opérateurs, permet de faire une analyse moyenne de plusieurs ACP portant sur les mêmes individus et les mêmes variables. Pour plusieurs AFC, dans les mêmes conditions, le problème des pondérations est résolu par l'AFC moyenne de Foucart (1978 - Sur les suites de tableaux de contingence indexés par le temps. Statistique et Analyse des données : 2, 67-84). Les données de Blondel et Farré (1988 - The convergent trajectories of bird communities along ecological successions in european forests. ‘cologia (Berlin) : 75, 83-93) illustrent avec précision les question qu'on peut ainsi aborder dans un cube de données. Rev. 94-12. 28 pages. 6-4 L'analyse factorielle multiple L'Analyse factorielle multiple (AFMULT) est une des méthodes les plus pratiques parmi les méthodes d'ordination simultanée de K tableaux. La fiche reprend les principaux travaux des auteurs de l'AFMULT, B. Escofier et J. Pages, pour décrire l'utilisation du module MFA (option Variable groups) qui contient cette méthode. Rev. 95-05. 26 pages. **************************************************************** Fascicule 7 Co-inertie de K tableaux 7-1 Analyses de co-inertie multiple : introduction L'Analyse de co-inertie multiple (ACOM : Chessel, D. & Hanafi, M., 1996 - Analyses de la co-inertie de K nuages de points. Revue de Statistique Appliquée , sous presse) généralise à K tableaux l'analyse de co-inertie (Dolédec, S. & Chessel, D., 1994 - Co-inertia analysis: an alternative method for studying species-environment relationships. Freshwater Biology : 31, 277-294) pour deux tableaux de la même manière que l'analyse canonique généralisée (Carrol, J.D., 1968 - A generalization of canonical analysis to three or more sets of variables. Proceeding of the 76th Convention of the American Psychological Association : 3, 227-228) généralise l'analyse canonique classique (Hotelling, H., 1936 - Relations between two sets of variates. Biometrika : 28, 321-377). La fiche décrit l'utilisation du module KTA qui contient cette méthode. Rev. 95-05. 22 pages. 7-2 ACOM et mesure de la valeur typologique L'Analyse de co-inertie multiple (ACOM) généralise à K tableaux l'analyse de coinertie pour deux tableaux. On la compare ici à STATIS en testant sa capacité à mesurer la valeur typologique des groupes faunistiques. Des logiques d'analyse distinctes conduisent à des résultats cohérents. Rev. 95-05. 14 pages. 7-3 ACOM et ordination de K ensembles de relevés On compare l'analyse de co-inertie multiple (ACOM) à la méthode STATIS en testant sa capacité à ordonner simultanément K ensembles de relevés. On utilise pour ce faire les données hydrobiologiques de la thèse de J. Verneaux (1973 - Cours d'eau de Franche-Comté (Massif du Jura). Recherches écologiques sur le réseau hydrographique du Doubs. Essai de biotypologie. Thèse d'état, Besançon. 1-257). Les trois exemples apportent une compréhension plus fine du rôle des deux méthodes. L'ACOM fait K analyses (coordonnées) et en trouve une moyenne. STATIS cherche une moyenne et en fait une analyse. Si chaque analyse est pertinente et mérite un examen approfondi, l'ACOM se justifie. Si chaque analyse est d'intérêt limité STATIS est plus clair. Dans la comparaison de peu d'études régionales comportant beaucoup de relevés, on pourra préférer l'ACOM. Dans la comparaison de nombreuses études régionales comportant un nombre limité de relevés, on devra s'en tenir à STATIS. Les deux méthodes sont centrées sur la notion de structures communes et les résultats communs qu'elles donnent avec des logiques différentes sont normalement cohérents. Rev. 95-05. 20 pages. 7-4 STATIS-AFMULT-ACOM : résumé (mêmes individus) La fiche résume la mise en ¦uvre des trois méthodes STATIS, AFMULT et ACOM. K tableaux portent sur les mêmes individus. On définit la structure des données et le centrage (KTabUtil). Le listing de sortie (STATIS-MFA-KTA) est reproduit et la signification du contenu des fichiers est brièvement rappelée. Les principales figures associées aux critères optimisés sont construites. On peut utiliser cette fiche comme mémento pour une mise en ¦uvre rapide. Rev. 95-06. 25 pages. **NOUVEAU** 7-5 Instabilité de descripteurs et stabilité de structures en végétation aquatique La fiche réunit un ensemble de pratiques de description d'un cube de données floristiques. Une première partie présente les données traîtées. La seconde effleure le nombre considérable d'approches possibles et compare les trois analyses simples de base. La troisième compare les différentes approches possibles du compromis temporel. La notion de structure spatiale stable à composantes instables est résumée par une analyse de co-inertie multiple. Rev. 95-05. 36 pages. **************************************************************** Fascicule 8 Exemples d'utilisation **NOUVEAU** 8-1 Questions-Réponses : Codage de modalités Cette fiche est un compte-rendu de consultation statistique pour M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon). Il décrit une approche possible des résultats d'une enquête, à partir des renseignement fournis par les auteurs. Il permettra de traiter quelques principes théoriques à partir de matériel concret dans un stage de formation destiné à des professeurs de mathématiques (corrélation, analyse en composantes principales, analyse des correspondances multiples, images euclidiennes). Cette première partie est consacrée à un examen détaillé des diverses parties du questionnaire. Rev. 95-04. 48 pages. **NOUVEAU** 8-2 Questions-Réponses : Correspondances multiples Cette fiche utilise l'enquête menée par M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon) pour décrire l'usage des modules utilisant des variables qualitatives. Cette deuxième partie illustre les manipulations associées à l'analyse des correspondances multiples d'un tableau faiblement structuré. On souligne les précautions à prendre dans la manipulation des cartes factorielles de modalités. Rev. 95-04. 24 pages. **************************************************************** Fascicule 9 Nouveautés **NOUVEAU** 9-1 STATICO : STATIS et Co-inertie La fiche décrit le mode d'emploi de l'analyse triadique partielle étendue aux opérateurs de co-inertie. La méthode, qu'on peut appeler STATICO, est une analyse triadique partielle sur les tableaux croisés dans les analyses de co-inertie. On combine alors la logique de STATIS (trouver ce qui dans plusieurs tableaux constitue le fond typologique commun, fond commun qui peut exister derrière de fortes particularités propres à chaque tableau) et la logique des couplages de co-inertie (trouver ce qui dans deux groupes de descripteurs engendre une typologie commune des objets décrits dans chacun des tableaux). Cette approche fait suite à une demande de l'équipe de D. Nandris (Phytopathologie, ORSTOM, Nouméa). Elle sera présentée aux XXVIIIe Journées de statistiques à Québec (mai 1996). Rev. 96-01. 39 pages. **NOUVEAU** 9-2 Analyses des correspondances et Ktableaux La fiche propose une introduction de la logique de l'analyse des correspondances dans l'usage des analyses à K-tableaux (STATIS et AFMULT). On présente un jeu de données (6 campagnes de chalutage dans le golfe du Lion) qui demande une approche analyses des correspondances des structures spatio-faunistiques. La simple utilisation de l'option CoaKTab dans KTabUtil permet l'usage de KTA, STATIS et AFMULT dans cette logique AFC. Des logiques internes très différentes conduisent à des résultats très proches. Rev. 96-02. 24 pages. **NOUVEAU** 9-3 Entre ACP et ACM : l'analyse de Hill et Smith Les données écologiques sont fréquemment structurées en groupes de relevés en particulier dans le temps et dans l'espace. Les données morphométriques peuvent être aussi structurées en groupe de descripteurs. Ces descripteurs peuvent être qualitatifs ou quantitatifs. On les réunit par type pour des critères techniques bien que biologiquement une classe signifiante de descripteurs puissent comprendre des variables de plusieurs types. A partir d'un problème difficile d'analyse de données génétiques, on décrit l'usage de l'analyse de Hill & Smith (1976) qui permet de mélanger variables qualitatives et quantitatives. Cette analyse est disponible dans le module MCA. Rev. 96-02. 30 pages. **NOUVEAU** 9-4 Inertie intra-classes et mesures de diversité Dans 25 stations on a mesuré 11 paramètres environnementaux en 10 points aléatoires. La variabilité stationelle définit la diversité mésologique. Dans ces 25 stations on a capturé 1008 poissons de 23 espèces. Ceci permet de définir la diversité taxonomique. Ces poissons portent 3 mesures morphométriques qui définissent la diversité stationelle de la taille des poissons d'une part et de la forme des poissons d'autre part. Une méthode générale de calcul de ces différentes composantes de la diversité est proposée (Discrimin : Within Parameters). Les relations entre ces composantes est analysées. La diversité de la forme est seule reliée à la diversité mésologique de manière complexe. L'indice de diversité est valable pour tous les types de variable. ****************************************************************