Bonjour,
La question de Marc Deconchat sur le test "Coa:total inertia analysis" a
déjà fait l'objet de plusieurs commentaires.
Résumons :
Un tableau de nombres positifs ou nuls peut être ou non une table de
contingence.
C'est une table de contingence si chaque cellule contient un nommbre entier
nij d'individus qui ont la caractéristique i des lignes et la
caractéristique j des colonnes. Dans ce cas on peut considérer qu'il y a n
individus qui se répartissent entre les cellules du tableau selon deux
critères.
Un tableau floro-faunistique n'est pratiquement jamais une vraie table de
contingence. C'est vrai pour les données en présence-absence, en classes
d'abondance, en recouvrement, en biomasse, ... Ces tableaux ne sont pas des
tables de contingence. Il arrive qu'on dénombre par placettes des plantes,
par unité de piégeage des insectes, des poissons par coup de filets, ...
Dans ce cas, on pourrait penser avoir à faire à une table de contingence
mais l'agrégativité des individus d'une même espèce (bosquet d'arbustes,
nuage de moucherons ou bancs de poissons, ...) garantit que le modèle
multinomial est faux et le khi2 n'est pas approprié à ce type de données.
En conséquence, le test "Coa:total inertia analysis" n'a pas de sens sur
les tableaux floro-faunistiques dans quasiment la totalité des cas. Ce qui
explique les remarques de la question posée par Marc.
La question est d'autre part très générale. Tout test statistique
fonctionne sur une zone de rejet de l'hypothèse nulle (par exemple (23, 57,
20) est un échantillon d'une loi multinomiale de paramètres n = 100 et
p1=0.25, p2=0.5, p3=0.25 ) au profit d'une alternative (par exemple p2>0.50
ou ce n'est pas une loi multinomiale ou ...)
En fonction de l'alternative, la zone de rejet (par exemple du khi2
d'ajustement de l'observation 23, 57, 20 à la distribution attendue 25, 50,
25) sera
- à droite (grandes valeurs) si on suppose (alternative) que les fréquences
théoriques (1/4, 1/2, 1/4) sont fausses (le test est alors significatif
pour 18, 70, 12)
- à gauche (petites valeurs) si on suppose (alternative) que l'auteur a
truqué les données (le test est alors significatif pour 24, 51, 25). C'est
un exemple célèbre.
Donc un même test peut être utilisé à gauche, à droite ou des deux côtés à
la fois suivant l'alternative. C'est pourquoi aussi deux tests basés sur la
même hypothèse nulle peuvent donner des résultats différents si l'un des
deux est destiné à rejeter l'hypothèse nulle au profit d'une alternative
qui se réalise dans les données ... Bon, un peu de pub pour un article
(Salut Gilles) qui réchauffe le c¦ur des statisticiens perdus dans la
toundra : Yoccoz, N.G. (1991) Use, overuse, and misuse of significance
tests in evolutionary biology ans ecology. Bulletin of the Ecological
Society of America : 72, 106-111.
Pour continuer la réflexion de Marc, on peut citer une question que J.
Estève posait dans le couloir. Cent biologistes font une expérience sans
intérêt (ce n'est possible, bien sur !). Un trouve que c'est signification
au seuil de 1%. Devinez qui va publier ?
>Concernant le test "Coa:total inertia analysis": est-ce que le test est
>significatif lorsque l'observé
>est supérieur à la distribution simulée (ce que je pense) ou lorsque la
>différence entre l'observé et le simulé est grande (dans un sens ou dans
>l'autre)?
...
>Est-ce qu'alors il n'est pas "risqué" de faire ce type de test sur des tables
>en présence/absence, avec beaucoup de cellules vides, ou bien l'expression
>"dans toutes les circonstances numériques" de la fiche descriptive du module
>veut dire qu'on peut aussi l'utiliser sur ce type de tableau de contingence?
Daniel Chessel
----------------------------------------------------------------
Universite Lyon 1 - Bat 401C - 69622 Villeurbanne CEDEX - France
Tel : 04 72 44 82 77 Fax : 04 72 43 11 41
----------------------------------------------------------------
This archive was generated by hypermail 2b30 : Sat Feb 10 2001 - 10:21:51 MET