Résumé | Nous étudions ici une méthode hybride stochastique déterministe pour résoudre les problèmes de l'ADN en présence de données biologiques à un très grand nombre de dimensions. Cette approche repose sur des réseaux dont l'apprentissage est assuré au moyen d'une combinaison des méthodes de l'annelage simulé et du gradient conjugué, dans un environnement informatique de fouille de données à grande échelle et haut débit. Des réseaux de grande qualité, du point de vue du pouvoir de discrimination et de généralisation, sont ainsi découverts. Les cartes de l'ADN générées par ces réseaux, en association avec des représentations non supervisées des données, permettent de mieux comprendre des données complexes à un grand nombre de dimensions comme celles qui interviennent dans les expériences sur les microréseaux d'expression du gène de la leucémie ou de la maladie d'Alzheimer. |
---|