Résumé | Les avancées rapides réalisées dans la recherche génomique ont produit une vaste quantité de données sur la séquence des nucléotides, et notamment des centaines de génomes complets (Entrez Genome). Il s'avère par conséquent nécessaire d'automatiser le processus de prédiction des gènes, pour que la quantité d'information disponible ne devienne pas un problème par elle-même. Il existe de nombreux moteurs de prédiction qui permettent de faciliter cette identification, mais leur champ d'application et leurs capacités de prédiction varient. Cet article étudie la possibilité d'améliorer la prédiction des gènes, en intégrant trois moteurs existants, GrailEXP, Genscan et MZEF, au moyen d'une combinaison modulaire de réseaux neuronaux experts, dans laquelle l'utilisation d'une architecture modulaire est en mesure de prendre en charge directement la nature partitionnée des sources de données originales. Les trois moteurs choisis représentent trois catégories différentes de logiciels de prédiction. Nous avons pu démontrer que le système d'intégration comportait des capacités de récupération significativement meilleures (proportion des exons prédits) que celles de n'importe quel des moteurs de prédiction individuels. Après intégration, nous avons été en mesure d'obtenir un coefficient de corrélation supérieur dans la prédiction des exons, et par conséquent une plus grande exactitude dans les résultats. <!-- Le programme est disponible en ligne à l'adresse <a href="http://cbr-rbc.nrc-cnrc.gc.ca/pany/integ.html ">http://cbr-rbc.nrc-cnrc.gc.ca/pany/integ.html</a>, avec des liens vers les données utilisées pour ce travail de recherche. --> |
---|