Conception d'un modèle d'IA dédié à l'identification de métabolites inconnus en exploitant les données NMR
Loading...
Date
2025
Journal Title
Journal ISSN
Volume Title
Publisher
UNIVERSITE MOHAMED BOUDIAF - M’SILA
Abstract
L’identification précise des métabolites demeure un défi majeur en métabolomique basée sur
la RMN.
Dans cette étude, nous avons développé une chaîne d’analyse supervisée utilisant un
classifieur Random Forest.
L'objectif de cette étude est de prédire les identifiants de la base de données HMDB à partir
de métadonnées expérimentales RMN incluant le solvant, le noyau, le nombre de pics, le pH, la
température et la référence de déplacement chimique. L’ensemble de données, agrégé à partir de
HMDB, a été prétraité par encodage catégoriel et normalisation. L’évaluation du modèle sur un
jeu de test indépendant a donné une exactitude de 33 %, une précision de 50 %, un rappel de 33 %,
un score F1 de 39 % et une perte logarithmique (log loss) de 1,48, révélant des déséquilibres entre
classes ainsi qu’une incertitude importante dans les prédictions probabilistes. Une interface
graphique (GUI) a été développée afin de permettre des prédictions interactives à partir des
métadonnées saisies par l’utilisateur.
Ces résultats démontrent la faisabilité d’une annotation métabolitique basée uniquement sur
les métadonnées et ouvrent la voie à des améliorations futures intégrant les données spectrales et
des approches par apprentissage ensembliste.
Description
Keywords
Spectroscopie RMN, Apprentissage automatique, Identification des métabolites, Forêt aléatoire, Métadonnées expérimentales, Annotation métabolomique