Analyse des données : bases

Introduction aux fonctions de base en analyse multivariée

[ http://pbil.univ-lyon1.fr/R/html/tdr5.html Version : 16.11.20]



 telecharger le pdf

 Ref : ter1 Taille : 903 ko  Version : 27.09.13 (4030 jours)

Représentations triangulaires

La représentation triangulaire place dans un triangle équilatéral un point pour représenter une distribution de fréquences sur trois catégories. Cette pratique élémentaire permet d'illustrer sans artifice quelques idées fondamentales de la statistique euclidienne.



 telecharger le pdf

 Ref : tdr601 Taille : 3040 ko  Version : 17.09.18 (2214 jours)

Initiation à l'analyse en composantes principales

Une première approche très intuitive et interactive de l'ACP. Centrage et réduction des données.



 telecharger le pdf

 Ref : tdr605 Taille : 1470 ko  Version : 19.11.19 (1785 jours)

Initiation à l'analyse en composantes principales

Une première approche très intuitive et interactive de l'ACP avec des données rééelles, voire historiques, de températures cardinales de croissance de micro-organismes ($T_{text{min}}$, $T_{text{opt}}$ et $T_{text{max}}$). Ayez confiance, nous ne vous jetterons pas dans le grand bassin multidimentionnel de l'ACP sans bouées.



 telecharger le pdf

 Ref : tdr610 Taille : 943 ko  Version : 27.09.13 (4030 jours)

Aucun titre


 telecharger le pdf

 Ref : tdr602 Taille : 797 ko  Version : 17.09.18 (2214 jours)

ACP d'un jeu de données très simple

On analyse les résultats de 104 étudiants dans 9 matières avec plusieurs analyses en composante principales pour montrer que les opérations de centrage et de réduction sont loin d'être innocentes.



 telecharger le pdf

 Ref : tdr603 Taille : 408 ko  Version : 19.09.18 (2212 jours)

AFC d'un jeu de données très simple

On analyse la couleur des yeux et des cheveux de 592 étudiants.



 telecharger le pdf

 Ref : tdr606 Taille : 894 ko  Version : 19.11.19 (1786 jours)

Évaluation du comportement de la renouée du Japon (Fallopia spp.) avec l'ACP

Analyse d'un tableau de 24 individus, des ramets de Fallopia spp., caractérisés par 13 variables quantitatives et trois variables qualitatives illustratives.



 telecharger le pdf

 Ref : tdr609 Taille : 513 ko  Version : 02.10.24 (7 jours)

Humidité du sol et Densité d'arbres

La fiche illustre la pratique de l'analyse des correspondances sur des données écologiques classiques. C'est une adaptation de plusieurs fiches proposées par D. Chessel, S. Dray et A.B. Dufour.


 telecharger le pdf

 Ref : tdr51 Taille : 873 ko  Version : 27.09.13 (4030 jours)

Composantes principales

Trois exemples numériques permettent d'aborder l'analyse en composantes principales par le biais de la fonction texttt{dudi.pca()} du paquet ade4.



 telecharger le pdf

 Ref : tdr60 Taille : 23995 ko  Version : 27.09.13 (4030 jours)

Trois variables pour commencer

Des premiers exercices pour voir que l'analyse des données réunit des données numériques, donc une réalité particulière, des supports théoriques, essentiellement de la géométrie euclidienne et des procédures qui permettent une interaction entre les deux.


 telecharger le pdf

 Ref : tdr53 Taille : 258 ko  Version : 27.09.13 (4030 jours)

Musique

Exercices simples pour repérer que dans une analyse en composantes principales, il est question en même temps de ressemblances (corrélation entre variables) et de différences (distance entre individus).


 telecharger le pdf

 Ref : tdr61 Taille : 2211 ko  Version : 18.02.17 (2790 jours)

Analyses en Composantes Principales

La fiche passe en revue quelques usages de l'analyse en composantes principales sur différents types de tableaux. On rencontre le non centrage, le décentrage, le double centrage autour des tableaux de pourcentages, de notes, de rangs ou de notes d'abondance. Dans cette famille, le cas le plus utilisé est celui de l'ACP normée ou ACP sur matrice de corrélation. Cette pratique est incontournable quand le tableau contient des variables de nature diverse. La variance dépendant des unités, elle n'a pratiquement que la fonction de permettre la normalisation, c'est-à-dire sa propre disparition. Les tableaux homogènes, au contraire comporte dans chaque cellule un nombre comparable au contenu des autres cellules, qu'il s'agisse d'une notation unique d'abondance, une présence-absence, un rang, un pourcentage, etc. L'usage de l'ACP normée peut alors être sans inconvénient ou au contraire obscurcir définitivement l'information. A l'aide d'exemples, la fiche regroupe des cas typiques qui permettra de faire des choix pertinents.



 telecharger le pdf

 Ref : tdr82 Taille : 1222 ko  Version : 27.09.13 (4030 jours)

Analyse en coordonnées principales

Aucun sommaire


 telecharger le pdf

 Ref : tdr611 Taille : 290 ko  Version : 27.09.13 (4030 jours)

Scientométrie

Nombre d'articles scientifiques par pays, deux tableaux à interpréter.


 telecharger le pdf

 Ref : tdr620 Taille : 430 ko  Version : 27.09.17 (2569 jours)

Initiation à l'analyse factorielle des correspondances

Dans cette fiche, on étudie l'Analyse Factorielle des Correspondances. Cette technique statistique permet de réduire le nombre de variables, afin d'obtenir une représentation graphique des tableaux de contingence. Elle vise à y rassembler la quasi-totalité de l'information initiale, en s'attachant aux correspondances entre les caractères.


 telecharger le pdf

 Ref : tdr62 Taille : 1132 ko  Version : 27.09.13 (4030 jours)

Pratique de l'analyse des correspondances

La fiche illustre la pratique de l'analyse des correspondances en écologie (ordination indirecte), sur des tables de contingence pour lesquelles elle est une analyse canonique et sur les tableaux de fréquences alléliques qui demandent l'introduction de la version intra-classes.



 telecharger le pdf

 Ref : tdr622 Taille : 6946 ko  Version : 27.09.16 (2933 jours)

L'effet arc-en-ciel

Exploration de l'effet Guttman (Guttman effect ou Arch effect ou horseshoe effect) dans l'analyse des correspondances au travers de simulations de données d'abondance d'espèces bactériennes le long d'un gradient thermique.)



 telecharger le pdf

 Ref : ter2 Taille : 2988 ko  Version : 27.09.13 (4030 jours)

L'ordination des tableaux écologiques

Cette fiche illustre l'utilisation des principales méthodes d'ordination en écologie. Elle s'appuie essentiellement sur l'utilisation du paquet ade4. D'autres paquets offrent également des fonctions équivalentes ou complémentaires (e.g. vegan, labdsv...). On pourra trouver dans le Task view Environmetrics (url{http://cran.r-project.org/src/contrib/Views/Environmetrics.html}) de l'information sur les paquets qui peuvent être utiles à un écologue.


 telecharger le pdf

 Ref : tdr521 Taille : 610 ko  Version : 27.09.13 (4030 jours)

Initiation à l'ACM : analyse des correspondances multiples

Un jeu de données très simple qui peut être analysé aussi bien en ACP qu'en ACM est utilisé pour une première approche introductive à l'ACM.



 telecharger le pdf

 Ref : tdr522 Taille : 630 ko  Version : 27.09.13 (4030 jours)

Rappel sur le rapport de corrélation et Exemple d'analyse des correspondances multiples

Dans cette séance, nous présentons le rapport de corrélation afin de mieux appréhender les objectifs des analyses des correspondances et des méthodes inter et intra tableaux.



 telecharger le pdf

 Ref : tdr52 Taille : 668 ko  Version : 27.09.13 (4030 jours)

Correspondances multiples

Introduction à l'analyse des correspondances multiples. Approche pratique des codages numériques. Tableaux de facteurs et tableaux disjonctifs complets. Approche procédurale et comparaison des fonctions dudi.acm et mca. Indications théoriques sur le schéma de dualité. Exemples et extensions.