Browsing by Author "MENASRI, Radja"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
Item Open Access Etude et analyse des effets d'acquisition optique à l'aide d'un OCR des textes arabes sur l’attribution d’auteurs(Univ M'sila, 2020) MENASRI, Radja; YAKOUBI, MebarkaRésumé Le développement technologique des divers moyens de communication numérique a conduit à une augmentation considérable des différents types de fichiers multimédias (audio, vidéo, texte) à travers plusieurs moyens. Les statistiques indiquent que les fichiers texte écrits sont les plus couramment utilisés par rapport aux autres types de fichiers multimédias. Ce développement extraordinaire et cette énorme quantité de textes écrits ont entraîné de grandes difficultés pour rechercher et en extraire des informations, en particulier l’identification des auteurs originaux. Dans ce travail de recherche, nous avons étudié le style d’écriture d'un groupe d'écrivains arabes contemporains à l’aide de leurs livres, dans le but d'attribuer des textes littéraires anonymes à leurs propriétaires, ces textes ont été obtenus à l'aide du programme de reconnaissance optique de caractères (OCR). Dans cette étude, nous avons créé une nouvelle base de données à cet effet, et nous avons proposé des algorithmes statistiques pour résoudre le problème de la classification automatique des auteurs et l'attribution des auteurs originaux. Abstract The technological development of various means of digital communication has led to a considerable increase in the different types of multimedia files (audio, video, text) through several means. Statistics indicate that written text files are the most commonly used compared to other types of media files. This extraordinary development and enormous quantity of written texts has created great difficulties in searching for and extracting information, in particular the identification of the original authors. In this research work, we studied the writing style of a group of contemporary Arab writers using their books, with the aim of attributing anonymous literary texts to their owners, these texts were obtained using the optical character recognition (OCR) program. In this study, we created a new database for this purpose, and we proposed statistical algorithms to solve the problem of automatic classification of authors and attribution of original authors. خ أدى التطّور التكنولوجي لمختلف وسائل الاتصال الرقمي إلى زيادة هائلة في مختلف أنواع ملفات الملتيميديا )الصوتية، الفيديو، النص يّ ة( عبر مختلف الوسائل. تشير الإحصائيات إلى أن الملفات النصية المكتوبة هي الأكثر تداولا مقارنة مع بقية أنواع ملفات الملتيميديا. هذا التطور الضخم والكم الهائل للنصوص المكتوبة نتج عنه من صعوبة بالغة في البحث واستخراج المعلومات ها و خاصة التعرف ال على كتاب نالأصليي اله . في هذا العمل البحثي قمنا بدارسة أسلوب مجموعة من الأ دباء المعاصرين العرب اته من خلال مؤلف م، بغرض ةاسناد نصوص أدبي مجهولة لأصحابها، هذه النصوص قد تم الحصول عليها باستعمال برنامج التعرف الضوئي ( على الحروف (OCR . في هذه الدراسة قمنا بإنشاء قاعدة بيانات جديدة لهذا الغرض كما قمنا باقتراح شك خوارزميات إحصائية لحل م .لة التصنيف الأتوماتيكي للمؤلفين والتعرف على الكتاب الأصليين