Essai de développement d'un modèle d'IA pour la prédiction de l'identité de métabolites inconnus par analyse de données analytiques

Loading...
Thumbnail Image

Date

2024-07

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mohamed Boudiaf - M’Sila

Abstract

Développer des modèles d'IA capables de prédire l'identité de métabolites inconnus dans des échantillons biologiques complexes grâce à l'analyse de données analytiques pourrait révolutionner la recherche en métabolomique. L'identification précise des métabolites est essentielle pour comprendre les processus biologiques, les mécanismes des maladies et les effets des médicaments. Les méthodes traditionnelles rencontrent souvent des difficultés en raison de la complexité et du volume des données, rendant l'identification des métabolites à la fois efficace et précise une tâche ardue. Cette étude vise à développer et déployer un modèle robuste d'identification de métabolites basé sur l'IA, surmontant les limitations des méthodes traditionnelles et fournissant un outil accessible pour des applications pratiques. Nous avons entraîné un modèle de réseau de neurones multi-sorties en utilisant TensorFlow, suivant un processus complet incluant le chargement d'un ensemble de données traité, l'encodage des étiquettes des colonnes Name et Formula, le prétraitement et le remplissage des pics pour assurer une longueur uniforme, la combinaison de diverses caractéristiques telles que MW, ExactMass et Num Peaks, la mise à l'échelle des caractéristiques à l'aide de StandardScaler, la division des données en ensembles d'entraînement (80%) et de test (20%), et la définition et l'entraînement du modèle de réseau de neurones. Pour le déploiement, nous avons développé une interface graphique utilisateur (GUI) utilisant Tkinter. Le modèle de réseau de neurones a été entraîné avec succès sans surcharge du système; cependant, il a obtenu une très faible précision, avec toutes les prédictions incorrectes. Nous soupçonnons que la cause en soit la méthode de prétraitement et de conversion des pics en format numérique. La limitation de cette étude réside dans le temps considérable nécessaire pour identifier l'algorithme correct pour prétraiter et convertir les pics avec précision, entraîner le modèle efficacement et intégrer les résultats dans la GUI. Les recherches futures devraient se concentrer sur l'optimisation des hyperparamètres, l'amélioration des techniques d'augmentation des données et l'intégration de méthodes de visualisation avancées pour améliorer les performances du modèle et l'expérience utilisateur.

Description

Keywords

IA, Identification des Métabolites, Réseaux de Neurones, Spectrométrie de Masse, Prétraitement des Données, Analyse Métabolomique.

Citation

Collections