BAS

Etude statistique des voisinages entre bases

CLEFS PERMISES : /LPT,/TOT,/CUM

MISE EN OEUVRE : BAS

BAS met en oeuvre un test non paramétrique (Gautier C., Gouy M., Louail S. 1985 ). La statistique BAS est définie à partir de deux ensembles de bases A1 et A2.

C'est le nombre de fois où une base de A1 est suivie d'une base de A2.

exemple :

Deux modèles sont proposés:

  1. Modèle de permutation des bases:

    Si la longueur de la séquence est L , il existe L! manières de permuter les bases. Pour chacune de ses L séquences, on pourrait calculer la statistique BAS et comparer les L! résultats ainsi obtenus au résultat de BAS sur la séquence réelle. En pratique ceci est impossible, le nombre L! étant beaucoup trop grand. Deux stratégies sont possibles, soit on échantillonne l'ensemble de ces L! séquences, c'est l'approche par simulation qui peut être mise en oeuvre par la commande SIM, soit on calcule une valeur BAS, telle que la fréquence, dans l'ensemble des L! séquences, des séquences ayant une valeur de BAS plus exceptionnelle que la valeur réelle soit approchée par la probabilité avec laquelle une variable N(0,1) dépasse, en valeur absolue, cette valeur BAS.

  2. Modèle de permutation des bases avec conservation de la position dans le codon:

    La démarche est la même mais l'ensemble de référence est constitué des 3((L/3)!) séquences obtenues en permutant entre elles les positions I,II,III des codons. La statistique BAS est calculée séparement pour les paires de positions I-II,II-III,III-I puis les 3 cumulées.