Soit une suite de variables à valeurs dans {−v,…,0,…,+u}. On définit le score local d'une séquence par Hn=max1⩽i⩽j⩽n(∑k=ijXk). Le score local est utilisé notamment dans l'analyse des séquences biologiques afin de mettre en évidence des régions de séquences ayant des propriétés biologiques intéressantes. La signification statistique des scores locaux calculés permet alors de mettre en évidence ce qui est réellement intéressant et il est donc nécessaire de connaı̂tre la distribution du score local. Nous établissons ici la loi exacte du score local dans le cas où la suite des Xi est une chaı̂ne de Markov d'ordre 1.
Given a sequence of random variables taking values in {−v,…,0,…,+u}, let's define the local score of the sequence by Hn=max1⩽i⩽j⩽n(∑k=ijXk). The local score is used to analyze biological sequences pointing out regions of the sequences with interesting biological properties. In order to separate randomly events from really interesting segments, we establish here the distribution of the local score of Hn when the sequence is a Markov chain of order 1.
Accepté le :
Publié le :
Sabine Mercier 1 ; Claudie Hassenforder 1
@article{CRMATH_2003__336_10_863_0, author = {Sabine Mercier and Claudie Hassenforder}, title = {Distribution exacte du score local, cas markovien}, journal = {Comptes Rendus. Math\'ematique}, pages = {863--868}, publisher = {Elsevier}, volume = {336}, number = {10}, year = {2003}, doi = {10.1016/S1631-073X(03)00208-5}, language = {fr}, }
Sabine Mercier; Claudie Hassenforder. Distribution exacte du score local, cas markovien. Comptes Rendus. Mathématique, Volume 336 (2003) no. 10, pp. 863-868. doi : 10.1016/S1631-073X(03)00208-5. https://comptes-rendus.academie-sciences.fr/mathematique/articles/10.1016/S1631-073X(03)00208-5/
[1] Distribution exacte du score local d'une suite de variables indépendantes et identiquement distribuées, C. R. Acad. Sci. Paris, Volume 329 (1999) no. 1, pp. 815-820
[2] Biological Sequence Analysis. Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK, 1998
[3] Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes, Proc. Nat. Acad. Sci. USA, Volume 87 (1990), pp. 2264-2268
[4] Limit distributions of maximal segmental score among Markov-dependent partial sums, Adv. Appl. Probab., Volume 24 (1992), pp. 113-140
[5] S. Mercier, Statistiques des scores pour l'analyse et la comparaison de séquences biologiques, Thèse de doctorat d'Université, Rouen, 1999
[6] Exact and asymptotic distribution for the local score of one i.i.d. random sequence, JOBIM 2000, Lecture Notes in Comput. Sci., 2066, 2001, pp. 74-85
[7] Exact distribution for the local score of one i.i.d. random sequence, J. Comp. Biol., Volume 8 (2001) no. 4, pp. 373-380
[8] Introduction to Computational Biology, Chapman and Hall, London, 1995
Cité par Sources :
Commentaires - Politique