Aichouche et Mokhnache, Mohamed et Belkasem2020-11-102020-11-102020http://dspace.univ-msila.dz:8080//xmlui/handle/123456789/20287Ce travail vise le domaine du Big data qui contient différents types de données provenant de différentes sources. Notre objectif consiste à extraire les informations et les connaissances à partir de fichiers contenant généralement des données non structurées en utilisant un traitement de langage naturel avec une ontologie de domaine. Le traitement vise à transformer les documents nos structurés en fichiers XM interrogeables.frBig data, document non structurée ,TALN ,XMLUn Web Scraper pour l’extraction de données Etude de cas : Recherche d’emplois et de profils dans le site LinkedInThesis