ldentification de la Langue Basée sur la Technique de Bi- Grammes et les Algorithmes de ML et DL
Loading...
Date
2023-06-10
Journal Title
Journal ISSN
Volume Title
Publisher
University of M'sila
Abstract
La détermination de la langue est une tâche cruciale visant à identifier avec précision une langue
spécifique dans un texte. La technique des bigrammes et les algorithmes d'apprentissage automatique
(ML) et d'apprentissage profond (DL) sont largement utilisés pour cette tâche. La technique des
bigrammes est un modèle linguistique statistique qui examine les paires de mots consécutifs dans le
texte pour déterminer la langue. Il utilise la distribution de fréquence des bigrammes pour déterminer
la langue du texte.Des algorithmes ML tels que Naive Bayes et Support Vector Machine (SVM) sont
largement utilisés pour déterminer la langue. Ces algorithmes fonctionnent en entraînant un modèle
sur un ensemble de données classées contenant différentes langues. Le modèle prédit ensuite la
langue d'un texte spécifique en fonction des modèles qu'il a appris.Des algorithmes DL tels que les
réseaux de neurones profonds (dNN) sont également utilisés pour déterminer la langue. Ces
algorithmes apprennent les modèles linguistiques inhérents en examinant les caractéristiques du texte
au niveau des caractères et des mots. Ils utilisent les représentations acquises pour prédire avec
précision la langue d'un texte spécifique.En conclusion, la technique des bigrammes et les
algorithmes ML et DL ont joué un rôle crucial dans la détermination de la langue et ont réalisé des
progrès significatifs dans l'identification précise d'une langue spécifique dans un texte.
Description
Keywords
Langue Basée : Technique de Bi- Grammes : Algorithmes : ML :DL