Résumé | Les motifs de cis-régulation sont souvent surreprésentés dans les promoteurs, et ils peuvent présenter un biais fréquentiel dans les régions SPR (pour subpromoter regions). De nombreux algorithmes probabilistes ont été utilisés pour prédire de tels motifs, mais ils ont tendance à produire de nombreux faux positifs. Nous avons conçu un nouvel algorithme, MotifFilter, qui calcule un indice de représentation (IR) pour les motifs présumés. l'IR calculé par MotifFilter est un rapport entre la fréquence réelle et la fréquence prévue d'un motif dans les promoteurs, les SPR ou l'ADN génomique aléatoire, qui prend en compte la distribution de probabilité des nucléotides dans ces régions. Cette méthode a été appliquée à une étude, à l'échelle du génome, des éléments de réaction cAMP (CRE pour cAMP-response elements) présumés, pour des motifs générés par un modèle de Markov caché. Vingt des 144 motifs CRE présumés découverts lors de cette étude ont été retenus par MotifFilter. |
---|