Standardzation

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Sat May 24 1997 - 12:46:46 MET DST


Réponse à la question d'Eric LALOUM (ci-dessous)

J'ai vérifié à plusieurs endroite et je crois bien que la réponse est non ! Ce qui vu la simplicité de la demande oblige à préciser un choix qui peut tout à fait se discuter. Une pondération des lignes dans ADE-4 est toujours de somme égale à 1.

La doc de Bin-Bin : Centring (Bin->Bin : Centring sur le Mac !) est effectivement implicite. La formule mj = Sum (pi*xij) qui définit la moyenne suppose que Sum (pi) = 1. Chaque fois que dans ADE-4 on demande Fichier des poids des lignes, on utilise la procédure lecponder (nom de vecteur, nom de fichier) qui divise systématiquement par la somme des poids. Si le nom de fichier est vide elle renvoie la pondération uniforme. Ce qui explique l'observation d'Eric.

Du point de vue mathématique ce choix n'a pas de raison. Il vient de la définition la plus commune de l'ACP, analyse du triplet (X0, Ip, D(1/n)) et de l'AFC. Par raison d'homogénéité il a été transporté partout : poids de voisinage, poids des lignes en ACM, régression pondérée, définition des bases orthonormales dans Projectors, cohérence des couplages de triplets en co-inertie, somme des poids unités par tableau dans le K-tableau ... A tel point qu'aucune procédure ne fait une standardization avec la métrique canonique.

Bravo pour l'art de poser des questions de fond de manière anodine

>J'ai un vecteur x (416-1) que j'aimerais standardiser.
>J'ai cree un fichier colonne p (416-1) ne contenant que des 1 pour ponderer



This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:31 MET