CorrigŽ ACP 9mars 98 (0484.htm)

From: Pierre WAVRESKY (Pierre.Wavresky@enesad.inra.fr)
Date: Fri Apr 21 2000 - 16:44:20 MET DST


<x-charset iso-8859-1>Bonjour,
J ai regarde recemment la liste des questions d'ADELIST, et je suis tombé
sur une question relative a l utilisation et surtout l interpretation de l
ACP dans les cas de notation (0 ou 1 ; ou -1 0 ou 1).
Daniel Chessel avait soumis un petit probleme quant a l interpretation d
une telle ACP.
Quelqu un (Daniel ou quelqu un d autre) pourrait repondre aux questions
posees (pour moi ce n est pas evident...)?
Merci,

Pierre Wavresky

Ci dessous, le petit probleme:

A la dernière question de Slim Masmoudi, on peut répondre que l'ACP a été
souvent utilisée avec des variables binaires (0-1 ou 1-2 ce qui revient au
même). Les statistiques d'inertie sont utilisables. Je rajoute un petit exo
pour les étudiants de deuxième année qui donne à réfléchir sur le fait que
c'est moins la nature des données que leur signification qui est en cause.

On considère un tableau comportant 10 lignes et 3 colonnes consignant
l'avis fourni par 10 consommateurs sur la qualité de 3 objets à l'aide du
code -1 (avis défavorable) 0 (sans opinion) et +1 (avis favorable)
Les 3 objets sont notés A,B,C et les 10 personnes interrogées sont
numérotées de 1 à 10.

        A B C
1 -1 -1 -1
2 -1 0 1
3 -1 0 0
4 1 1 1
5 0 0 1
6 -1 -1 0
7 0 0 0
8 0 1 1
9 -1 0 1
10 -1 1 1

Le tableau est traité par une analyse en composantes principales centrée
(diagonalisation de la matrice de covariance) qui donne:
MOYENNES ET VARIANCES DU FICHIER DE DEPART
A: -.50 .45
B: +.10 .49
C: +.50 .45

MATRICE DES COVARIANCES

                   A B C
                ------- ------- -------
A 0.4500 0.2500 0.1500
B 0.2500 0.4900 0.3500
C 0.1500 0.3500 0.4500

VALEURS PROPRES

1:.9760E+00/0.70220/0.70220
2:.3112E+00/0.22392/0.92611
3:.1027E+00/0.07389/1.00000

NOMBRE DE FACTEURS CONSERVES 2

COORDONNEES DES LIGNES
...

COORDONNEES DES COLONNES
...

a) Indiquer brièvement quelle information est apportée par cette analyse.
Quelle question n'est manifestement pas abordée par cette opération ?

b) On décide alors de transposer le tableau et de considérer qu'il comporte
3 individus (produits) et 10 variables (consommateurs). Calculer les
moyennes et les variances de l'ACP centrée du nouveau tableau (Exprimer les
résultats sous forme de fractions). Quand on veut diagonaliser la matrice
de covariances on obtient les messages:

1:.2731E+01/0.87796/0.87796
2:.3797E+00/0.12204/1.00000
3:.6508E-06/0.00000/1.00000
4:.7040E-07/0.00000/1.00000
5:.1052E-13/0.00000/1.00000
6:.4450E-14/0.00000/1.0000
VALEUR PROPRE NEGATIVE 7 -6.07772E-15
VALEUR PROPRE NEGATIVE 8 -2.27279E-08
VALEUR PROPRE NEGATIVE 9 -1.29848E-07
VALEUR PROPRE NEGATIVE 10 -1.18605E-06

Expliquer pourquoi. Calculer la matrice de dimension minimale qu'il suffit
de diagonaliser pour faire cette analyse (Exprimer les résultats sous forme
de fractions). Quelles sont les dimensions de cette matrice et son rang ?
Calculer ses valeurs propres en utilisant ce qui précède.

c) Les coordonnées factorielles des lignes fournies par le programme après
cette diagonalisation sont:
      1 2
   ------- -------
A* +2.1900 +0.3044
B* -0.3879 -0.8593
C* -1.8021 +0.5549

Peut-on considérer que la diagonalisation de la matrice de covariance s'est
normalement déroulée? En utilisant les coordonnées des colonnes de cette
analyse consignées ci-dessous, décrire brièvement l'information apportée
par cette analyse.

     1 2
* ------- -------
1* +0.0000 +0.0000
2* -0.8052 +0.1355
3* -0.4417 -0.1647
4* -0.0000 -0.0000
5* -0.3635 +0.3002
6* -0.3635 +0.3002
7* +0.0000 +0.0000
8* -0.4417 -0.1647
9* -0.8052 +0.1355
10* -0.8834 -0.3294

Lequel des consommateurs est-il le plus représentatif de l'opinion
collective ?

N.B. Quand les deux ACP centrées possibles pour un tableau sont utilisables
on dit traditionnellement que l'une est en mode Q et l'autre en mode R.

Bon courage

</x-charset>



This archive was generated by hypermail 2b30 : Mon Feb 12 2001 - 09:24:54 MET