Étude de la stabilité de la sélection de variables pour la classification de données
Loading...
Files
Date
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
UNIVERSITE MOHAMED BOUDIAF - M’SILA
Abstract
La classification des données, ont motivé le développement de méthodes
statistiques pour la sélection de variables. La préparation de la base de données dans des
applications de développement des outils de supervision/diagnostic à l’aide des modèles
basés sur les techniques d’apprentissage statistiques consiste à retenir les variables les plus
représentatives des données observées. L’utilisation de ces techniques augmente dans
l’industrie de production puisqu’ils permettant le développement de robustes modèles nonlinéaires
d’unités de procédés industriels complexes, ces données contiennent un très grand
nombre de variables. Cette association d'une dimensionnalité élevée à une petite taille
d’échantillon fait de la sélection de variables une étape préalable indispensable pour
diminuer les temps de calcul, et améliorer l'interopérabilité des modèles. Dans le cadre de
ce travail de mémoire, nous avons tout d'abord cherché à déterminer quels sont les facteurs,
au niveau des données, qui influencent le plus la stabilité de la sélection, sur tout de type
de données. Nous avons ensuite travaillé sur des méthodes de classification, en nous
focalisant tout d'abord sur l'influence de la stabilité de la sélection sur les ces méthodes
étudiées.