Re: donnees friday87

From: Daniel Chessel (chessel@biomserv.univ-lyon1.fr)
Date: Tue Aug 29 2006 - 16:51:16 MEST

  • Next message: 2005-08-29 23:35:2: "x----SPAM----x $B65$($F$'!D("

    Intéressante question de Luis Tito qui m'a obligé à retrouver l'article
    d'origine.

    Intéressante parce qu'elle soulève la question de la reproductibilité
    des articles.
    En 1994 et en écologie, la question n'était pas posée.
    L'article de Friday est un exemple d'école de transparebce de données
    hydrobiologiques.
    Maintenant les gens sérieux accompagnent leurs articles de tous les
    éléments pour refaire les calculs.
    Par exemple voir les [ONLINE REPRODUCIBILITY
    <http://pbil.univ-lyon1.fr/members/lobry/repro/gene06/>] à
    http://pbil.univ-lyon1.fr/members/lobry/

    Il y a 4 objets en cause.
    1) les données de l'article de Laurie Friday
    2) les données utilisées dans l'article sur la co-inertie
    3) les données dans la pile data de ADE-4 classique
    4) les données de l'objet friday87 de la librairie ade4

    2) 3) et 4) sont extraits au digit près de 1)
    3) et 4) sont identiques
    3) est contenu dans 2)

    Les données de 3) pour le milieu reproduise les labels des plans d'eau
    mais dans le même ordre que pour la faune, ce qui n'est pas le cas de
    l'article d'origine.
    Dans 1) on trouve le nombre d'espèces d'invertébrés (qui est un
    sous-produit du tableau faune), le nombre d'espèces de macrophytes qui
    doit être un sous produit d'un tableau floristique qui n'est pas
    disponible, puis

    "pond.area" "veg.area" "pH" "Conduc" "BOD" "hardness" "Alkali"

    puis Calcium qui n'a pas été reproduit car non déterminé (not determined n.d.) pour 9 sites

    puis

    "Phospha" "Nitra"

    puis Turbidity qui n'a pas été conservée.

    Les valeurs de cette variable sont :
      Q P R J E C D K B A G M L F H N
     0.8 3.6 0.6 1.0 3.0 15.0 10.0 15.0 15.0 20.0 5.5 10.0 60.0 2.5 5.7 3.0

    Donc "No invertebrate taxa" et "No. macrophytes species" ont été écartées comme variable biotiques : on ne conserve que des variables morphométriques et physico-chimiques.
    Calcium a été écartée à cause des données manquantes.
    Turbidity pose une question : je ne me rappelle aucune raison pour ne pas avoir inclue cette variable. Peut-être que la mention de l'unité utilisée
    Formazin units
    m'était inconnue. Maintenant Google "Formazin units" et on est expert.
    Avant, pour une faute de frappe, on montrait qu'on parlait de ce qu'on ne connaissait pas.
    Mais je n'en sais pas plus.
    C'est même bizarre, parce qu'elle n'est pas particulièrement corrélée à une autre et que c'est une observation classique.
    Elle figure effectivement dans 4).

    Donc on la remettra.
    Tito peux-tu nous dire si, avec cette variable et le jeu de donnée de friday87, tu peux reproduire l'article sur la co-inertie ?
    merci et vive la reproductibilité !

    D. Chessel

    Tito de Morais Luis a écrit :
    > Bonjour chers "listeurs"
    >
    > J'ai voulu refaire pour un étudiant l'exemple de co-inertie décrit page
    > 283 et suivantes dans le papier "fondateur" Dolédec et Chessel, 1994
    > dans Freshwater Biol., vol. 31
    >
    > Mais je suis un peu perplexe, en effet page 283 il est d'abord question
    > de "ninety-one taxa and eleven environmental variables" suivi d'une
    > liste de 12 variables. En revanche dans les traitements qui suivent il
    > n'est plus question que de 11 variables effectivement (le calcium
    > "disparaît" entre temps).
    >
    > Et dans le jeu de données friday87 qui vient avec ade4 sous R il n'y a
    > plus que 9 variables environnementales :
    >
    >> names(friday87$mil)
    >>
    > [1] "pond.area" "veg.area" "pH" "Conduc" "BOD" "hardness"
    > [7] "Alkali" "Phospha" "Nitra"
    >
    > Par rapport aux 11 variables utilisées dans l'article, "maximum depth"
    > et "turbidity" sont absentes (de même que "calcium").
    >
    > Je précise que je n'ai pas l'article d'origine de Friday. Je ne sais
    > donc pas si l'ensemble des données sont récupérables sur le papier. Mais
    > quelqu'un pourrait-il me fournir le tableau avec les données
    > effectivement utilisées dans l'article de Sylvain et Daniel ?
    >
    > Par ailleurs pour quelle(s) raison(s) les 3 variables ont-elles été
    > supprimées dans le jeu friday87 ? Quelqu'un peut-il éclairer ma lanterne
    > perplexe ?
    >
    > Merci beaucoup de vos lumières !
    >
    > L. Tito
    >



    This archive was generated by hypermail 2b30 : Tue Aug 29 2006 - 16:53:14 MEST