Documentation thématique

Volume 2: Analyses élémentaires

Introduction to Linear Data Analysis
This file describes the main features of the mathematical model associated with the linear multivariate methods incorporated into ADE-4 software. The main characteristics of statistical computation for one-table analysis are incorporated. ADE-4 is a data analysis package designed for descriptive statistics, which is useful for large data sets to investigate the structure or the organisation of data. 32 pages.

Principal Component Analysis (PCA)
This file describes the computation and usual graphical display of a normalised principal components analysis (PCA) processed on physical and chemical data (Carrel et al., 1986). Alternative computation and graphical representations (canonical graphs, cartography of scores, data reconstitution) are also presented. 36 pages.

Correspondence Analysis
This file describes the computation and usual graphical display of a correspondence analysis processed on bird count data (Auda et al., 1983). 18 pages.

Multiple Correspondence Analysis
This is an introduction to the analysis of tables containing categorical (qualitative) data. In this case, values are represented by modalities. These modalities can be ordered resulting in an ordinal coding. In this file we perform a multiple correspondence analysis on a data set dealing with cat's fecundity (Pontier, 1984). 12 pages.

Fuzzy Correspondence Analysis
The paper deals with the multiple correspondence analysis extended to fuzzy coded disjunctive arrays. The example concerns aquatic Coleoptera species and was treated in the paper by Chevenet et al. (1994). 20 pages.

Between and within groups PCA
In this file, the statistical analysis of a multivariate environmental array is described. Quantitative variables collected at s locations for t sampling dates are analysed. To have a distinct view of the respective influence of the seasonal succession and the sample location on the variability of the measures, principal components analyses were used on tables from the linear model of variance analysis in a two-way layout with one observation per cell (Dolédec & Chessel, 1987). Moreover, this file introduces to the use of multivariate techniques using projection onto a subspace. 27 pages.

Structures à une seule dimension Il arrive qu'une analyse multivariée conduise à l'interprétation d'un seul facteur. La fiche regroupe la description des outils graphiques qui sont utiles dans cette circonstance. 30 pages

Analyse Non Symétrique des Correspondances La fiche décrit le principe et l'usage de l'analyse non symétrique des correspondances créée par Lauro, N. & D'Ambra, L. (1984, in : Data Analysis and Informatics III. Diday, E. & Coll. (Eds.) Elsevier, North-Holland. 433-446). Le test de Light, R.J. & Margolin, B.H. (1971, An analysis of variance for categorical data. Journal of the American Statistical Association : 66, 534-544) lui est associée dans les deux options NSCA du module COA. L'enregistrement des occurrences d'espèces à partir des collections, de la littérature ou des relevés exploratoires est particulièrement en accord avec cette approche. L'asymétrie des relations espèces-relevés vues par l'averaging est abordée. 30 pages.

Questions-Réponses : Codage de modalités Cette fiche est un compte-rendu de consultation statistique pour M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon). Il décrit une approche possible des résultats d'une enquête, à partir des renseignement fournis par les auteurs. Il permettra de traiter quelques principes théoriques à partir de matériel concret dans un stage de formation destiné à des professeurs de mathématiques (corrélation, analyse en composantes principales, analyse des correspondances multiples, images euclidiennes). Cette première partie est consacrée à un examen détaillé des diverses parties du questionnaire. 48 pages.

Questions-Réponses : Correspondances multiples Cette fiche utilise l'enquête menée par M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon) pour décrire l'usage des modules utilisant des variables qualitatives. Cette deuxième partie illustre les manipulations associées à l'analyse des correspondances multiples d'un tableau faiblement structuré. On souligne les précautions à prendre dans la manipulation des cartes factorielles de modalités. 24 pages.

Entre ACP et ACM : l'analyse de Hill et Smith Les données écologiques sont fréquemment structurées en groupes de relevés en particulier dans le temps et dans l'espace. Les données morphométriques peuvent être aussi structurées en groupe de descripteurs. Ces descripteurs peuvent être qualitatifs ou quantitatifs. On les réunit par type pour des critères techniques bien que biologiquement une classe signifiante de descripteurs puissent comprendre des variables de plusieurs types. A partir d'un problème difficile d'analyse de données génétiques, on décrit l'usage de l'analyse de Hill & Smith (1976, Principal component analysis of taxonomic data with multi-state discrete characters. Taxon : 25, 249-255) qui permet de mélanger variables qualitatives et quantitatives. 30 pages.

Analyse des correspondances avec colonne de référence Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution associée à la colonne de référence définit le poids des lignes, l'origine dans l'ensemble des profils colonnes et la métrique du Khi2 dans cet espace. L'inertie est alors une somme de Khi2 d'ajustement. La fiche donne donc un exemple d'analyse des correspondances sur modèles de B. Escofier (Analyse factorielle en référence à un modèle. Applications à l'analyse d'un tableau d'échanges. Revue de Statistique Appliquée : 32, 4, 25-36, 1984).

Les tableaux de fréquences alléliques La fiche répond à une question posée plusieurs fois sur le forum Adelist " Que faire avec un tableau de fréquences alléliques ? " La connexion faite par B. Guinand avec l'analyse des correspondances floues est contestable dans son fondement. On montre qu'un tableau de fréquences alléliques dérive simplement d'un tableau de génotypes par une moyenne en absence de données manquantes. L'inertie inter-classe est directement reliée à la mesure de fixation du Fst. On introduit un codage des données manquantes pour respecter cette propriété en utilisant les propositions en úuvre dans le logiciel GENETIX (http://www.univ-montp2.fr/~genetix/genetix.htm). L'ACP inter-classe et l'AFC inter-classe de ces tableaux est appropriée. Elles permettent une représentation optimale des individus et des populations.

Retour au sommaire de la Doc. thématique

	Introduction to Linear Data Analysis This file describes the main features of the mathematical model associated with the linear multivariate methods incorporated into ADE-4 software. The main characteristics of statistical computation for one-table analysis are incorporated. ADE-4 is a data analysis package designed for descriptive statistics, which is useful for large data sets to investigate the structure or the organisation of data. 32 pages.
	Principal Component Analysis (PCA) This file describes the computation and usual graphical display of a normalised principal components analysis (PCA) processed on physical and chemical data (Carrel et al., 1986). Alternative computation and graphical representations (canonical graphs, cartography of scores, data reconstitution) are also presented. 36 pages.
	Correspondence Analysis This file describes the computation and usual graphical display of a correspondence analysis processed on bird count data (Auda et al., 1983). 18 pages.
	Multiple Correspondence Analysis This is an introduction to the analysis of tables containing categorical (qualitative) data. In this case, values are represented by modalities. These modalities can be ordered resulting in an ordinal coding. In this file we perform a multiple correspondence analysis on a data set dealing with cat's fecundity (Pontier, 1984). 12 pages.
	Fuzzy Correspondence Analysis The paper deals with the multiple correspondence analysis extended to fuzzy coded disjunctive arrays. The example concerns aquatic Coleoptera species and was treated in the paper by Chevenet et al. (1994). 20 pages.
	Between and within groups PCA In this file, the statistical analysis of a multivariate environmental array is described. Quantitative variables collected at s locations for t sampling dates are analysed. To have a distinct view of the respective influence of the seasonal succession and the sample location on the variability of the measures, principal components analyses were used on tables from the linear model of variance analysis in a two-way layout with one observation per cell (Dolédec & Chessel, 1987). Moreover, this file introduces to the use of multivariate techniques using projection onto a subspace. 27 pages.
	Structures à une seule dimension Il arrive qu'une analyse multivariée conduise à l'interprétation d'un seul facteur. La fiche regroupe la description des outils graphiques qui sont utiles dans cette circonstance. 30 pages
	Analyse Non Symétrique des Correspondances La fiche décrit le principe et l'usage de l'analyse non symétrique des correspondances créée par Lauro, N. & D'Ambra, L. (1984, in : Data Analysis and Informatics III. Diday, E. & Coll. (Eds.) Elsevier, North-Holland. 433-446). Le test de Light, R.J. & Margolin, B.H. (1971, An analysis of variance for categorical data. Journal of the American Statistical Association : 66, 534-544) lui est associée dans les deux options NSCA du module COA. L'enregistrement des occurrences d'espèces à partir des collections, de la littérature ou des relevés exploratoires est particulièrement en accord avec cette approche. L'asymétrie des relations espèces-relevés vues par l'averaging est abordée. 30 pages.
	Questions-Réponses : Codage de modalités Cette fiche est un compte-rendu de consultation statistique pour M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon). Il décrit une approche possible des résultats d'une enquête, à partir des renseignement fournis par les auteurs. Il permettra de traiter quelques principes théoriques à partir de matériel concret dans un stage de formation destiné à des professeurs de mathématiques (corrélation, analyse en composantes principales, analyse des correspondances multiples, images euclidiennes). Cette première partie est consacrée à un examen détaillé des diverses parties du questionnaire. 48 pages.
	Questions-Réponses : Correspondances multiples Cette fiche utilise l'enquête menée par M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon) pour décrire l'usage des modules utilisant des variables qualitatives. Cette deuxième partie illustre les manipulations associées à l'analyse des correspondances multiples d'un tableau faiblement structuré. On souligne les précautions à prendre dans la manipulation des cartes factorielles de modalités. 24 pages.
	Entre ACP et ACM : l'analyse de Hill et Smith Les données écologiques sont fréquemment structurées en groupes de relevés en particulier dans le temps et dans l'espace. Les données morphométriques peuvent être aussi structurées en groupe de descripteurs. Ces descripteurs peuvent être qualitatifs ou quantitatifs. On les réunit par type pour des critères techniques bien que biologiquement une classe signifiante de descripteurs puissent comprendre des variables de plusieurs types. A partir d'un problème difficile d'analyse de données génétiques, on décrit l'usage de l'analyse de Hill & Smith (1976, Principal component analysis of taxonomic data with multi-state discrete characters. Taxon : 25, 249-255) qui permet de mélanger variables qualitatives et quantitatives. 30 pages.
	Analyse des correspondances avec colonne de référence Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution associée à la colonne de référence définit le poids des lignes, l'origine dans l'ensemble des profils colonnes et la métrique du Khi2 dans cet espace. L'inertie est alors une somme de Khi2 d'ajustement. La fiche donne donc un exemple d'analyse des correspondances sur modèles de B. Escofier (Analyse factorielle en référence à un modèle. Applications à l'analyse d'un tableau d'échanges. Revue de Statistique Appliquée : 32, 4, 25-36, 1984).
	Les tableaux de fréquences alléliques La fiche répond à une question posée plusieurs fois sur le forum Adelist " Que faire avec un tableau de fréquences alléliques ? " La connexion faite par B. Guinand avec l'analyse des correspondances floues est contestable dans son fondement. On montre qu'un tableau de fréquences alléliques dérive simplement d'un tableau de génotypes par une moyenne en absence de données manquantes. L'inertie inter-classe est directement reliée à la mesure de fixation du Fst. On introduit un codage des données manquantes pour respecter cette propriété en utilisant les propositions en úuvre dans le logiciel GENETIX (http://www.univ-montp2.fr/~genetix/genetix.htm). L'ACP inter-classe et l'AFC inter-classe de ces tableaux est appropriée. Elles permettent une représentation optimale des individus et des populations.