A la dernière question de Slim Masmoudi, on peut répondre que l'ACP a été
souvent utilisée avec des variables binaires (0-1 ou 1-2 ce qui revient au
même). Les statistiques d'inertie sont utilisables. Je rajoute un petit exo
pour les étudiants de deuxième année qui donne à réfléchir sur le fait que
c'est moins la nature des données que leur signification qui est en cause.
On considère un tableau comportant 10 lignes et 3 colonnes consignant
l'avis fourni par 10 consommateurs sur la qualité de 3 objets à l'aide du
code -1 (avis défavorable) 0 (sans opinion) et +1 (avis favorable)
Les 3 objets sont notés A,B,C et les 10 personnes interrogées sont
numérotées de 1 à 10.
A B C
1 -1 -1 -1
2 -1 0 1
3 -1 0 0
4 1 1 1
5 0 0 1
6 -1 -1 0
7 0 0 0
8 0 1 1
9 -1 0 1
10 -1 1 1
Le tableau est traité par une analyse en composantes principales centrée
(diagonalisation de la matrice de covariance) qui donne:
MOYENNES ET VARIANCES DU FICHIER DE DEPART
A: -.50 .45
B: +.10 .49
C: +.50 .45
MATRICE DES COVARIANCES
A B C
------- ------- -------
A 0.4500 0.2500 0.1500
B 0.2500 0.4900 0.3500
C 0.1500 0.3500 0.4500
VALEURS PROPRES
1:.9760E+00/0.70220/0.70220
2:.3112E+00/0.22392/0.92611
3:.1027E+00/0.07389/1.00000
NOMBRE DE FACTEURS CONSERVES 2
COORDONNEES DES LIGNES
...
COORDONNEES DES COLONNES
...
a) Indiquer brièvement quelle information est apportée par cette analyse.
Quelle question n'est manifestement pas abordée par cette opération ?
b) On décide alors de transposer le tableau et de considérer qu'il comporte
3 individus (produits) et 10 variables (consommateurs). Calculer les
moyennes et les variances de l'ACP centrée du nouveau tableau (Exprimer les
résultats sous forme de fractions). Quand on veut diagonaliser la matrice
de covariances on obtient les messages:
1:.2731E+01/0.87796/0.87796
2:.3797E+00/0.12204/1.00000
3:.6508E-06/0.00000/1.00000
4:.7040E-07/0.00000/1.00000
5:.1052E-13/0.00000/1.00000
6:.4450E-14/0.00000/1.0000
VALEUR PROPRE NEGATIVE 7 -6.07772E-15
VALEUR PROPRE NEGATIVE 8 -2.27279E-08
VALEUR PROPRE NEGATIVE 9 -1.29848E-07
VALEUR PROPRE NEGATIVE 10 -1.18605E-06
Expliquer pourquoi. Calculer la matrice de dimension minimale qu'il suffit
de diagonaliser pour faire cette analyse (Exprimer les résultats sous forme
de fractions). Quelles sont les dimensions de cette matrice et son rang ?
Calculer ses valeurs propres en utilisant ce qui précède.
c) Les coordonnées factorielles des lignes fournies par le programme après
cette diagonalisation sont:
1 2
------- -------
A* +2.1900 +0.3044
B* -0.3879 -0.8593
C* -1.8021 +0.5549
Peut-on considérer que la diagonalisation de la matrice de covariance s'est
normalement déroulée? En utilisant les coordonnées des colonnes de cette
analyse consignées ci-dessous, décrire brièvement l'information apportée
par cette analyse.
1 2
* ------- -------
1* +0.0000 +0.0000
2* -0.8052 +0.1355
3* -0.4417 -0.1647
4* -0.0000 -0.0000
5* -0.3635 +0.3002
6* -0.3635 +0.3002
7* +0.0000 +0.0000
8* -0.4417 -0.1647
9* -0.8052 +0.1355
10* -0.8834 -0.3294
Lequel des consommateurs est-il le plus représentatif de l'opinion collective ?
N.B. Quand les deux ACP centrées possibles pour un tableau sont utilisables
on dit traditionnellement que l'une est en mode Q et l'autre en mode R.
Bon courage
>Bon, j'ai deux autres questions :
>
>- Est ce que le fait que les variales aient uniquement deux modalites (1
>et 2) generait l'utilisation d'une ACP?
>
>- Dans l'interpretation des axes de l'ACP, en plus des correlations des
>variables, peut-on utiliser les contributions de ces variables ou la
>qualite de la representation (contribution des axes aux positions des
>variables) pour renforcer l'interpretation?
Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:52 MET