Re: ACPVI (Isa Cornille)

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Fri Apr 26 2002 - 16:11:31 MET DST

  • Next message: Olivier Beauchard: "(no subject)"

    At 14:11 26/04/2002 +0200, isa cornille wrote:
    >Je vous écris pour une question relative au logiciel ADE-4 que je suis
    >amenée à utiliser depuis peu.
    >J'utilise le module projector pour faire une analyse de la redondance
    >(analyse assymétrique à l'issue de deux ACP sur mes matrices espèces et
    >variables environnementales). Je ne comprends pas bien la différence
    >entre les fichiers ivli et ivl1. Le fichier ivli correspond d'après ce que
    >j'ai compris à la position de mes stations dans le nouveau repère de
    >variables environnementales mais à quoi correspond alors le fichier ivl1?
    >Lorsque l'on veut calculer le score des variables environnementales afin
    >d'en réaliser un graphique, il semble que ce soit le fichier ivl1 qui est
    >utilisé dans Mat alg/ diagonal inner product. Or, pour obtenir le score
    >des variables environnementales on doit faire la corrélation entre ces
    >variables environnementales et le score des stations (qui selon moi serait
    >le fichier ivli). Qu'est ce qui intervient donc dans le calcul du score
    >des variables environnementales?

    La question pratique recouvre une question de fond : pourquoi 3 fichiers
    ivl1, ivli et ivls en ACPVI
    On trouve de l'info dans la fiche thema35 p. 34 qu'on peut résumer comme suit.
    Quand on fait une ACPVI avec deux ACP de départ, on obtient 6 fichiers qui
    vont 3 par 3.
    ----------------------------------------------------
    Premier point de vue ivc1 + ivls + ivli
    ----------------------------------------------------
    ivc1 contient des poids des variables dépendantes (celles du tableau X qui
    est projeté)
    la première colonne de ce fichier est un ensemble de poids numériques des
    variables de X
    ivls contient les combinaisons linéaires des variables de X avec les poids
    qui précèdent (contrainte = somme des carrés unité).
    Comme dans une ACP ordinaire ivls est une combinaison linéaire de variables.
    Si l'ACP était simple cette combinaison serait de variance maximum
    En ACPVI le critère optimisé est variance x carré de corrélation multiple
    donc ivls contient des coordonnées d'ACP les plus prédictibles possibles
    par les variables explicatives (celle du tableau Y qui défint l'espace de
    projection).
    Les prédictions de ivls par Y sont dans ivli.
    On dépouille donc avec ivc1 (poids des variables) et superposition ivls
    (combinaisons des variables) et ivli (prédiction des précédentes par Y).

    ---------------------------------------------------------
    Deuxième point de vue ivfa + ivl1 + ivco
    ---------------------------------------------------------
    ivfa contient des poids des variables explicatives (celles de Y). Ce
    fichier n'existe que si il n'y a pas de redondance entre explicatives
    (sinon le modèle est indéterminé).
    Ces poids donne des combinaisons des variables de Y qui existent toujours
    (si il n'y a pas de ivfa c'est qu'on peut les écrire de multiples façons)
    de variances unité (comme en analyse discriminante ou en analyse canonique)
    qui sont dans ivl1
    ivl1 sont donc des combinaisons linéaires d'explicatives de variances
    unités comme des composantes principales en ACP ordinaire. En ACP ordinaire
    la première composante maximiserait la somme des carrés des covariances
    (donc des corrélations pour une ACP normée) avec les variables du même
    tableau (Y). Ici elle fait la même chose avec les variables du tableau des
    variables dépendantes (X). Ces corrélations (cas d'une ACP normée) sont
    dans ivco.

    On dépouille donc avec ivfa (poids des explicatives), ivl1 combinaisons
    d'explicatives, ivco corrélation entre explicatives de synthèse et
    variables à expliquer. Pour le premier facteur, on peut faire les graphes
    ivl1 en abscisse, variables de X en ordonnées comme dans une ACP et on a
    combinaison de variables de X prédisant simultanément le plus possible les
    variables de Y (régression simultanée avec un modèle unique).

    On a résolu deux problèmes différents d'un coup et les ivl1 sont les ivli
    ramenées à la variance unité.

    Il est prudent de comparer les ivfa (poids des variables dans la régression
    de synthèse) avec les corrélation entre les le prédicteur (ivl1) et les
    variables à expliquer (qui doivent être calculées par MatAlg: Diagonal
    Inner product C=X'DY) soit en partant de ivl1 (pas la peine de normaliser)
    soit de ivli (en normalisant on obtiendra la même chose). C'est le lien
    entre la solution des deux problèmes qui a généré la question.

    Daniel Chessel
    Universite Lyon 1 - Biométrie et Biologie Evolutive - Bât 741
    69622 Villeurbanne CEDEX



    This archive was generated by hypermail 2b30 : Fri Apr 26 2002 - 16:14:03 MET DST