En bref

Je suis Professeur des Universités en Informatique depuis 2011 et chargé de mission "Fouille de textes - Information Scientifique et Technique" auprès de l' INS2I du CNRS. Membre du laboratoire LSIS, je suis responsable de l' équipe DIMAG "Data, Information & content Management Group" (15 enseignants-chercheurs et 18 doctorants) dont les activités sont centrées autour des systèmes d'information, de la recherche d'information et de la fouille de données.

Directeur adjoint de la Fédération FRIIAM et vice-président de la société savante ARIA depuis 2015, je suis également directeur scientifique de l' OpenEdition Lab de l'équipement d'excellence (Equipex) OpenEdition.org DILOH (Digital Library for Open Humanities) au sein du CLEO (Centre pour l'Edition Electronique Ouverte - CLEO-OpenEdition). Depuis 2016, je suis président du comité technique du projet PIA ISTEX et enfin membre du comité de pilotage de la TGIR Huma-Num .

Lauréat en 2011 et 2012 d’un Google Research Award en humanités numériques dans le domaine de l’extraction d’information au sein d’articles scientifiques, ses recherches actuelles portent sur la fouille de textes, l’analyse de sentiments et les méthodes numériques de recherche d’information et de recommandation automatique de contenus.

My research deal with Information Retrieval and Natural Language Processing and more specifically with Information Retrieval and Extraction in large collections of documents (Web pages, digital libraries), sentiment analysis and query oriented recommender systems. I have been President of the Technical Committee of the initiative ISTEX since 2016, head of OpenEdition Lab since 2011 and of the DIMAG team in LSIS since 2013. Between 2000 and 2011, I proposed several methods for classifying texts (unsupervised decision trees) and for segmenting them (weighted lexical chains) in order to improve information retrieval. During the ANR CAAS (2010-2013) project, we proposed a method for contextualizing and expanding queries and then methods for filtering Web pages targeting specific entities (by means of a new diachronic probabilistic model). The Google Digital Humanities Award I received with Marin Dacos (OpenEdition.org) in 2011 allowed us to begin a concrete collaboration with OpenEdition for employing NLP approaches for improving navigation and searching in the context of a digital library in Social Science & Humanities. Since then, we have proposed approaches for the automatic creation of links between articles in journals, books and blogs by analyzing common references and citations, and we developed a recommender system integrating information retrieval, automatic classification and sentiment analysis of book reviews. For these different activities, we place great emphasis on participating to international challenges such as CLEF Social Book Search for query based recommandation, Semeval for sentiment analysis, TREC and CLEF for question-answering, TREC Entity, KBA, Medical for information retrieval and filtering. Between 2010 and 2014, I have been one of the organizers of the track Tweet Contextualization in CLEF along with IRIT and LIMSI labs.

Mon activité d'enseignement s'effectue au sein de l'Ecole d'ingénieurs Polytech Marseille (responsable des cours d'analyse de données, de génie logiciel et de recherche d'information multimédia) mais aussi du Master Informatique et de son parcours Recherche SIS (cours tronc commun d'introduction aux systèmes d'information et à la recherche d'information, cours de spécialité en recherche d'information sémantique, extraction d'information et recherche d'information personnalisée).

Pour plus d'information, vous pouvez consulter mon CV.

Mes publications sont disponibles:

Thèmes de recherche

Courte biographie

J’ai soutenu une thèse de Doctorat en Informatique en 2000 autour du problème de la dualité entre classification et segmentation thématiques de textes. J’ai pour cela travaillé sur des approches essentiellement numériques en proposant des méthodes non supervisées et en développant un système de recherche d'information (SIAC). Je suis ensuite devenu Maître de conférences à l'Université d'Avignon et des Pays de Vaucluse, au sein du laboratoire d'Informatique d'Avignon (LIA).

En 2002, je suis devenu responsable d’un DESS puis en 2004 d’une spécialité de Master Informatique centrée sur le traitement de l’information et l’ingénierie logicielle. En 2008, j’ai effectué un séjour d’enseignement au Vietnam et j’ai soutenu mon habilitation à diriger des recherches (HDR) autour de la personnalisation de la recherche d’information avec des applications aux systèmes de questions-réponses, à la recherche de documents audio et à la prise en considération de certains handicaps langagiers tels la dyslexie.

En 2010, je suis devenu Directeur du Département Informatique (Directeur des Etudes du CERI) de l’Université d’Avignon. J’ai obtenu en 2011 et 2012 deux Google Digital Humanities Awards pour conduire des travaux en extraction d’information pour les bibliothèques numériques.

En 2011, je suis devenu Professeur en Informatique au sein d'Aix-Marseille Université, école Polytech, laboratoire LSIS.