|
Introduction to Linear Data Analysis
This file describes the main features of the mathematical model associated with
the linear multivariate methods incorporated into ADE-4 software. The main characteristics
of statistical computation for one-table analysis are incorporated. ADE-4 is a data analysis
package designed for descriptive statistics, which is useful for large data sets to investigate
the structure or the organisation of data. 32 pages.
|
|
Principal Component Analysis (PCA)
This file describes the computation and usual graphical display of a normalised principal
components analysis (PCA) processed on physical and chemical data (Carrel et al., 1986).
Alternative computation and graphical representations (canonical graphs, cartography of scores,
data reconstitution) are also presented. 36 pages.
|
|
Correspondence Analysis
This file describes the computation and usual graphical display of a correspondence
analysis processed on bird count data (Auda et al., 1983). 18 pages.
|
|
Multiple Correspondence Analysis
This is an introduction to the analysis of tables containing categorical (qualitative) data.
In this case, values are represented by modalities. These modalities can be ordered resulting
in an ordinal coding. In this file we perform a multiple correspondence analysis on a data
set dealing with cat's fecundity (Pontier, 1984). 12 pages.
|
|
Fuzzy Correspondence Analysis
The paper deals with the multiple correspondence analysis extended to fuzzy coded
disjunctive arrays. The example concerns aquatic Coleoptera species and was treated
in the paper by Chevenet et al. (1994). 20 pages.
|
|
Between and within groups PCA
In this file, the statistical analysis of a multivariate environmental array is described.
Quantitative variables collected at s locations for t sampling dates are analysed.
To have a distinct view of the respective influence of the seasonal succession
and the sample location on the variability of the measures, principal components analyses
were used on tables from the linear model of variance analysis in a two-way layout with one
observation per cell (Dolédec & Chessel, 1987). Moreover, this file introduces to the use
of multivariate techniques using projection onto a subspace. 27 pages.
|
|
Structures à une seule dimension
Il arrive qu'une analyse multivariée conduise à l'interprétation d'un seul facteur.
La fiche regroupe la description des outils graphiques qui sont utiles dans cette
circonstance. 30 pages
|
|
Analyse Non Symétrique des Correspondances
La fiche décrit le principe et l'usage de l'analyse non symétrique des correspondances créée par
Lauro, N. & D'Ambra, L. (1984, in : Data Analysis and Informatics III. Diday, E. & Coll. (Eds.)
Elsevier, North-Holland. 433-446). Le test de Light, R.J. & Margolin, B.H. (1971, An analysis
of variance for categorical data. Journal of the American Statistical Association : 66, 534-544)
lui est associée dans les deux options NSCA du module COA. L'enregistrement des occurrences
d'espèces à partir des collections, de la littérature ou des relevés exploratoires est
particulièrement en accord avec cette approche. L'asymétrie des relations espèces-relevés
vues par l'averaging est abordée. 30 pages.
|
|
Questions-Réponses : Codage de modalités
Cette fiche est un compte-rendu de consultation statistique pour M. Le Berre, J. Reynaud-Feurly et
H. Zucchetta (IREM de Lyon). Il décrit une approche possible des résultats d'une enquête, à partir
des renseignement fournis par les auteurs. Il permettra de traiter quelques principes théoriques à
partir de matériel concret dans un stage de formation destiné à des professeurs de mathématiques
(corrélation, analyse en composantes principales, analyse des correspondances multiples, images
euclidiennes). Cette première partie est consacrée à un examen détaillé des diverses parties du
questionnaire. 48 pages.
|
|
Questions-Réponses : Correspondances multiples
Cette fiche utilise l'enquête menée par M. Le Berre, J. Reynaud-Feurly et H. Zucchetta (IREM de Lyon)
pour décrire l'usage des modules utilisant des variables qualitatives. Cette deuxième partie illustre
les manipulations associées à l'analyse des correspondances multiples d'un tableau faiblement
structuré. On souligne les précautions à prendre dans la manipulation des cartes factorielles
de modalités. 24 pages.
|
|
Entre ACP et ACM : l'analyse de Hill et Smith
Les données écologiques sont fréquemment structurées en groupes de relevés en particulier dans le
temps et dans l'espace. Les données morphométriques peuvent être aussi structurées en groupe de
descripteurs. Ces descripteurs peuvent être qualitatifs ou quantitatifs. On les réunit par type
pour des critères techniques bien que biologiquement une classe signifiante de descripteurs
puissent comprendre des variables de plusieurs types. A partir d'un problème difficile d'analyse
de données génétiques, on décrit l'usage de l'analyse de Hill & Smith (1976, Principal component
analysis of taxonomic data with multi-state discrete characters. Taxon : 25, 249-255) qui permet
de mélanger variables qualitatives et quantitatives. 30 pages.
|
|
Analyse des
correspondances avec colonne de référence
Quand une table de contingence contient une colonne de poids très élevé, cette colonne
peut servir de point de référence. La distribution associée à la colonne de
référence définit le
poids des lignes, l'origine dans l'ensemble des profils colonnes et la métrique du Khi2 dans cet
espace. L'inertie est alors une somme de Khi2 d'ajustement. La fiche donne donc un exemple
d'analyse des correspondances sur modèles de B. Escofier (Analyse factorielle en référence
à un modèle. Applications à l'analyse d'un tableau d'échanges. Revue de Statistique
Appliquée : 32, 4, 25-36, 1984).
|
|
Les tableaux de fréquences alléliques
La fiche répond à une question posée plusieurs fois sur le forum Adelist " Que
faire avec un tableau de fréquences alléliques ? " La connexion faite par B.
Guinand avec l'analyse des correspondances floues est contestable dans son
fondement. On montre qu'un tableau de fréquences alléliques dérive simplement
d'un tableau de génotypes par une moyenne en absence de données manquantes.
L'inertie inter-classe est directement reliée à la mesure de fixation du Fst. On
introduit un codage des données manquantes pour respecter cette propriété en
utilisant les propositions en úuvre dans le logiciel GENETIX
(http://www.univ-montp2.fr/~genetix/genetix.htm). L'ACP inter-classe et l'AFC
inter-classe de ces tableaux est appropriée. Elles permettent une représentation
optimale des individus et des populations.
|