Des réseaux de neurones pour prédire des distances interatomiques extraites d'une base de données ouverte de calculs en chimie quantique
Résumé
Le calcul de la géométrie de l'état fondamental d'une molécule est le
point de départ de l'immense majorité des travaux en chimie quantique molécu-
laire. La base de données ouverte PubChemQC met à disposition les résultats de
calculs des états fondamentaux pour plus de trois millions de molécules. Nous
avons extrait les géométries convergées afin d'entraîner des modèles d'appren-
tissage automatique. Prédire la géométrie complète serait une avancée remar-
quable. Nos premiers résultats suggèrent qu'il est difficile d'entraîner un réseau
de neurones sur cette tâche complexe. Par contre, nous démontrons qu'un ré-
seau de neurones est capable de prédire précisément une distance entre deux
atomes. L'objet d'étude de ce travail est la distance la plus complexe en chimie
organique, la distance carbone-carbone. Les meilleurs résultats sont obtenus en
limitant la quantité d'information grâce à une distance seuil autour de chaque
carbone.