Re: ACPVI (Isa Cornille)

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Apr 26 2002 - 16:11:31 MET DST

Next message: Olivier Beauchard: "(no subject)"

Previous message: Daniel Chessel: "Re:"
In reply to: isa cornille: "(no subject)"
Next in thread: Olivier Beauchard: "(no subject)"
Messages sorted by: [ date ] [ thread ] [ subject ] [ author ]

At 14:11 26/04/2002 +0200, isa cornille wrote:
>Je vous écris pour une question relative au logiciel ADE-4 que je suis
>amenée à utiliser depuis peu.
>J'utilise le module projector pour faire une analyse de la redondance
>(analyse assymétrique à l'issue de deux ACP sur mes matrices espèces et
>variables environnementales). Je ne comprends pas bien la différence
>entre les fichiers ivli et ivl1. Le fichier ivli correspond d'après ce que
>j'ai compris à la position de mes stations dans le nouveau repère de
>variables environnementales mais à quoi correspond alors le fichier ivl1?
>Lorsque l'on veut calculer le score des variables environnementales afin
>d'en réaliser un graphique, il semble que ce soit le fichier ivl1 qui est
>utilisé dans Mat alg/ diagonal inner product. Or, pour obtenir le score
>des variables environnementales on doit faire la corrélation entre ces
>variables environnementales et le score des stations (qui selon moi serait
>le fichier ivli). Qu'est ce qui intervient donc dans le calcul du score
>des variables environnementales?

La question pratique recouvre une question de fond : pourquoi 3 fichiers
ivl1, ivli et ivls en ACPVI
On trouve de l'info dans la fiche thema35 p. 34 qu'on peut résumer comme suit.
Quand on fait une ACPVI avec deux ACP de départ, on obtient 6 fichiers qui
vont 3 par 3.
----------------------------------------------------
Premier point de vue ivc1 + ivls + ivli
----------------------------------------------------
ivc1 contient des poids des variables dépendantes (celles du tableau X qui
est projeté)
la première colonne de ce fichier est un ensemble de poids numériques des
variables de X
ivls contient les combinaisons linéaires des variables de X avec les poids
qui précèdent (contrainte = somme des carrés unité).
Comme dans une ACP ordinaire ivls est une combinaison linéaire de variables.
Si l'ACP était simple cette combinaison serait de variance maximum
En ACPVI le critère optimisé est variance x carré de corrélation multiple
donc ivls contient des coordonnées d'ACP les plus prédictibles possibles
par les variables explicatives (celle du tableau Y qui défint l'espace de
projection).
Les prédictions de ivls par Y sont dans ivli.
On dépouille donc avec ivc1 (poids des variables) et superposition ivls
(combinaisons des variables) et ivli (prédiction des précédentes par Y).

---------------------------------------------------------
Deuxième point de vue ivfa + ivl1 + ivco
---------------------------------------------------------
ivfa contient des poids des variables explicatives (celles de Y). Ce
fichier n'existe que si il n'y a pas de redondance entre explicatives
(sinon le modèle est indéterminé).
Ces poids donne des combinaisons des variables de Y qui existent toujours
(si il n'y a pas de ivfa c'est qu'on peut les écrire de multiples façons)
de variances unité (comme en analyse discriminante ou en analyse canonique)
qui sont dans ivl1
ivl1 sont donc des combinaisons linéaires d'explicatives de variances
unités comme des composantes principales en ACP ordinaire. En ACP ordinaire
la première composante maximiserait la somme des carrés des covariances
(donc des corrélations pour une ACP normée) avec les variables du même
tableau (Y). Ici elle fait la même chose avec les variables du tableau des
variables dépendantes (X). Ces corrélations (cas d'une ACP normée) sont
dans ivco.

On dépouille donc avec ivfa (poids des explicatives), ivl1 combinaisons
d'explicatives, ivco corrélation entre explicatives de synthèse et
variables à expliquer. Pour le premier facteur, on peut faire les graphes
ivl1 en abscisse, variables de X en ordonnées comme dans une ACP et on a
combinaison de variables de X prédisant simultanément le plus possible les
variables de Y (régression simultanée avec un modèle unique).

On a résolu deux problèmes différents d'un coup et les ivl1 sont les ivli
ramenées à la variance unité.

Il est prudent de comparer les ivfa (poids des variables dans la régression
de synthèse) avec les corrélation entre les le prédicteur (ivl1) et les
variables à expliquer (qui doivent être calculées par MatAlg: Diagonal
Inner product C=X'DY) soit en partant de ivl1 (pas la peine de normaliser)
soit de ivli (en normalisant on obtiendra la même chose). C'est le lien
entre la solution des deux problèmes qui a généré la question.

Daniel Chessel
Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
69622 Villeurbanne CEDEX

Next message: Olivier Beauchard: "(no subject)"
Previous message: Daniel Chessel: "Re:"
In reply to: isa cornille: "(no subject)"
Next in thread: Olivier Beauchard: "(no subject)"
Messages sorted by: [ date ] [ thread ] [ subject ] [ author ]

This archive was generated by hypermail 2b30 : Fri Apr 26 2002 - 16:14:03 MET DST