Doctoral Dissertations
Permanent URI for this collection
Browse
Browsing Doctoral Dissertations by Author "Nasereddine AMROUNE"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Open Access Développement d’une nouvelle approche pour la classification non supervisée de données(University of M'Sila, 2025-10-09) Nasereddine AMROUNELe partitionnement spatial de données basé sur la densité avec bruit (DBSCAN) est un algorithme de clustering largement utilisé, capable d'identifier des groupes de formes arbitraires et de gérer efficacement les données bruitées. Cependant, la performance de l'algorithme dépend du choix de deux paramètres cruciaux : Eps (epsilon) et MinPts (nombre minimum de points). Eps définit le rayon dans lequel rechercher les points de données voisins, tandis que MinPts spécifie le nombre minimum de points requis pour former une région dense. La détermination de la valeur optimale d'Eps est un défi bien connu dans DBSCAN. Une valeur fixe d'Eps peut être inadéquate pour les ensembles de données contenant des clusters de densités variables. Si Eps est défini trop petit, les clusters de faible densité pourraient être classés à tort comme du bruit, tandis qu'une grande valeur d'Eps pourrait conduire à la fusion de clusters distincts de haute densité. Dans cette thèse, nous relevons ce défi en proposant un algorithme DBSCAN modifié qui élimine le besoin de spécification manuelle d'Eps. Notre approche exploite l'algorithme des k plus proches voisins (kNN) pour calculer de manière adaptative une valeur Eps pour chaque point de données en fonction de la densité de son voisinage local. Ce calcul adaptatif d'Eps permet à notre algorithme d'identifier efficacement les clusters avec des densités hétérogènes, une tâche avec laquelle le DBSCAN traditionnel a du mal. En automatisant le processus de sélection d'Eps et en l'adaptant aux caractéristiques de densité locales des données, notre algorithme DBSCAN modifié améliore la flexibilité et la précision du clustering basé sur la densité. Cette contribution est particulièrement précieuse pour les ensembles de données réels, qui présentent souvent des distributions de densité diverses. Notre approche simplifie le processus de réglage des paramètres, rendant DBSCAN plus accessible et convivial, tout en améliorant sa capacité à découvrir des structures de cluster complexes dans les données.