Browsing by Author "Rapporteur: GADRI, Said"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Open Access ldentification de la Langue Basée sur la Technique de Bi- Grammes et les Algorithmes de ML et DL(University of M'sila, 2023-06-10) Hamouda, Hadjer; Djegham, Fatima; Rapporteur: GADRI, SaidLa détermination de la langue est une tâche cruciale visant à identifier avec précision une langue spécifique dans un texte. La technique des bigrammes et les algorithmes d'apprentissage automatique (ML) et d'apprentissage profond (DL) sont largement utilisés pour cette tâche. La technique des bigrammes est un modèle linguistique statistique qui examine les paires de mots consécutifs dans le texte pour déterminer la langue. Il utilise la distribution de fréquence des bigrammes pour déterminer la langue du texte.Des algorithmes ML tels que Naive Bayes et Support Vector Machine (SVM) sont largement utilisés pour déterminer la langue. Ces algorithmes fonctionnent en entraînant un modèle sur un ensemble de données classées contenant différentes langues. Le modèle prédit ensuite la langue d'un texte spécifique en fonction des modèles qu'il a appris.Des algorithmes DL tels que les réseaux de neurones profonds (dNN) sont également utilisés pour déterminer la langue. Ces algorithmes apprennent les modèles linguistiques inhérents en examinant les caractéristiques du texte au niveau des caractères et des mots. Ils utilisent les représentations acquises pour prédire avec précision la langue d'un texte spécifique.En conclusion, la technique des bigrammes et les algorithmes ML et DL ont joué un rôle crucial dans la détermination de la langue et ont réalisé des progrès significatifs dans l'identification précise d'une langue spécifique dans un texte.