Conception d'un modèle d'IA dédié à l'identification de métabolites inconnus en exploitant les données NMR

Loading...
Thumbnail Image

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

UNIVERSITE MOHAMED BOUDIAF - M’SILA

Abstract

L’identification précise des métabolites demeure un défi majeur en métabolomique basée sur la RMN. Dans cette étude, nous avons développé une chaîne d’analyse supervisée utilisant un classifieur Random Forest. L'objectif de cette étude est de prédire les identifiants de la base de données HMDB à partir de métadonnées expérimentales RMN incluant le solvant, le noyau, le nombre de pics, le pH, la température et la référence de déplacement chimique. L’ensemble de données, agrégé à partir de HMDB, a été prétraité par encodage catégoriel et normalisation. L’évaluation du modèle sur un jeu de test indépendant a donné une exactitude de 33 %, une précision de 50 %, un rappel de 33 %, un score F1 de 39 % et une perte logarithmique (log loss) de 1,48, révélant des déséquilibres entre classes ainsi qu’une incertitude importante dans les prédictions probabilistes. Une interface graphique (GUI) a été développée afin de permettre des prédictions interactives à partir des métadonnées saisies par l’utilisateur. Ces résultats démontrent la faisabilité d’une annotation métabolitique basée uniquement sur les métadonnées et ouvrent la voie à des améliorations futures intégrant les données spectrales et des approches par apprentissage ensembliste.

Description

Keywords

Spectroscopie RMN, Apprentissage automatique, Identification des métabolites, Forêt aléatoire, Métadonnées expérimentales, Annotation métabolomique

Citation

Collections