Source : ResearchGate
📂 Publications en accès ouvert (HAL)
18 documents disponibles en accès libre
83% de publications en accès ouvert — Retrouvez mes articles, communications et autres travaux sur l'archive ouverte HAL.
- 11 communications dans des congrès
- 4 articles de revue
- 1 thèse
- 1 ouvrage
- 1 brevet
Archive ouverte nationale française
📚 Livre
La boîte translucide : Un éclairage sur l'intelligence artificielle
EDP Sciences, Janvier 2021
L'intelligence artificielle. Un concept aujourd'hui si populaire, une réalité pourtant si décriée. De quoi s'agit-il exactement ? Quel rapport entretient-elle avec le cerveau humain ? Quelles en seraient les limites ?
L'auteur entend répondre à ces questions avec un double objectif : présenter une introduction agile aux univers de l'informatique et éclairer les enjeux éthiques et sociétaux de l'IA.
Chapitres principaux :
- Introduction : de la « matière grise »
- La machine raisonnante
- La machine apprenante
- Conclusion et perspectives
💡 Brevet
Disambiguation for the Classification of Lexical Items
L'invention concerne le domaine de la classification des éléments lexicaux. Plus spécifiquement, elle porte sur la désambiguïsation de la classification d'éléments lexicaux pouvant appartenir à différentes classes. L'invention décrit la création et l'utilisation d'un arbre d'éléments lexicaux, où chaque nœud comprend un élément lexical et un nombre permettant la résolution des ambiguïtés.
Voir le brevet →📄 Publications récentes
SIMI : un système de suggestion de littérature médicale
Preprint, Juin 2022
Démonstration de SIMI, un système de suggestion de littérature médicale entièrement automatisé. À partir d'une description d'un cas clinique en français, SIMI extrait les termes médicaux présents en résolvant simultanément les éventuelles ambiguïtés, traduit les termes en anglais et construit une requête de recherche documentaire.
Voir la publication →SIDRES : A Novel Annotation Tool For The Automatic Detection Of Semantic Entities
Conference Paper, Octobre 2021
Présentation d'un nouvel outil d'annotation nommé SIDRES (Système Interactif de Détection et de Reconnaissance d'Entités Sémantiques). SIDRES fournit un environnement d'annotation pour la classification d'unités textuelles à partir de catégories ad hoc avec désambiguïsation contextuelle.
Voir la publication →Entity Recognition and Language Identification with FELTS
Working notes, CLEF 2017 - Microblog Cultural Contextualization Lab
Expériences menées dans le cadre du Microblog Cultural Contextualization Lab de CLEF 2017. Approche non-statistique basée sur des dictionnaires pour la reconnaissance d'entités dans des textes courts et hétérogènes de microblogs.
Voir la publication →A Second Life for TIIARA: From Bilingual to Multilingual!
Février 2016
TIIARA (Taxonomy for Image Indexing and Retrieval) est une taxonomie bilingue développée pour l'indexation et la recherche d'images. Ce travail étend le vocabulaire contrôlé vers un système multilingue offrant des points d'accès innovants et cohérents.
Voir la publication →Design, implementation and experiment of a YeSQL Web Crawler
Décembre 2012
Description d'un crawler web "focalisable", scalable et distribué basé sur GNU/Linux et PostgreSQL, conçu pour être facilement extensible et publié sous licence GNU. Étude de cas sur l'analyse des flux Twitter lors des élections présidentielles françaises de 2012.
Voir la publication →Unsupervised mining of knowledge gaps in scientific literature
Juin 2010
La découverte au travers de la littérature (Literature Based Discovery) repose sur l'identification des lacunes dans la littérature scientifique. Proposition d'une méthode non supervisée ne nécessitant pas de bases de connaissances spécifiques.
Voir la publication →📄 Travaux à Cambridge University (1997-2000)
Durant ma période à l'Université de Cambridge, j'ai contribué à de nombreuses publications sur la recherche documentaire parlée (Spoken Document Retrieval) dans le cadre des campagnes d'évaluation TREC.
The Cambridge Multimedia Document Retrieval (MDR) Project: Summary of experiments
Technical Report, Août 2001
Rapport synthétisant les travaux expérimentaux réalisés dans le cadre du projet Multimedia Document Retrieval à Cambridge University.
The Cambridge University Multimedia Document Retrieval Demo System
Juillet 2001
Le système CU-MDR est une application web permettant d'interroger une base de données de transcriptions automatiques d'émissions de radio. Le système télécharge quotidiennement les flux audio de stations britanniques et américaines, les transcrit et les indexe.
Voir la publication →Information Retrieval from Unsegmented Broadcast News Audio
Janvier 2001
Description d'un système de recherche de portions pertinentes dans des émissions d'information à partir des données audio brutes. Méthode de détection automatique des publicités améliorant les performances du système.
Voir la publication →Spoken document representations for probabilistic retrieval
Speech Communication, Septembre 2000
Développements en expansion de requêtes et représentation de documents pour la recherche documentaire parlée. Évaluation de l'impact des techniques de retrieval sur différents ensembles de transcriptions.
Voir la publication →Spoken Document Retrieval for TREC-9 at Cambridge University
TREC 2000
Utilisation des transcriptions CUHTK de TREC-8 (WER de 20.5%) avec stopping, Porter stemming, pondération Okapi et expansion de requêtes avec un corpus contemporain de dépêches.
Voir la publication →Effects of out of vocabulary words in spoken document retrieval
SIGIR 2000
Étude des effets des mots hors vocabulaire (OOV) sur la recherche documentaire parlée. Création de plusieurs ensembles de transcriptions avec différentes tailles de vocabulaire.
Voir la publication →General Query Expansion Techniques For Spoken Document Retrieval
EUROSPEECH 1999
Développements en expansion de requêtes et représentation de documents. Amélioration de 17% de l'Average Precision par rapport au système de base.
Voir la publication →The Cambridge University spoken document retrieval system
ICASSP 1999
Description du système de recherche documentaire parlée développé à Cambridge, évalué sur 50 heures de données broadcast news. Moteur de reconnaissance basé sur HTK et moteur de recherche utilisant les techniques de City University.
Voir la publication →Improving Retrieval on Imperfect Speech Transcriptions
SIGIR 1999
Voir la publication →Spoken Document Retrieval For TREC7 At Cambridge University
TREC 1998
Système de reconnaissance à 2 passes utilisant HTK avec un taux d'erreur mot de 24.8%, le plus bas de la piste. Moteur de recherche Okapi adapté de TREC-6.
Voir la publication →📄 Thèse et travaux antérieurs
Approche bimodale du traitement automatique de la parole : Application à la reconnaissance du message et du locuteur
Thèse de doctorat, Avril 1998
Étude sur l'intégration des informations visuelles (mouvement et forme des lèvres) dans les systèmes de traitement automatique de la parole. Description technique des systèmes d'acquisition audiovisuelle et approches expérimentales.
Voir la thèse →Handling Disynchronization Phenomena with HMM in Connected Speech
Avril 1998
Les phénomènes d'anticipation et de rétention entre les organes phonatoires ont été largement étudiés en perception et production de la parole. Définition d'un produit d'automates à transitions valuées pour gérer ces difficultés dans les HMM.
Voir la publication →Integrating acoustic and labial information for speaker identification and verification
AVBPA 1997
Voir la publication →Acoustic-Labial Speaker Verification
Juillet 1997
Approche multimodale pour la vérification du locuteur utilisant des caractéristiques visuelles et acoustiques. Extraction de caractéristiques visuelles par suivi des lèvres (forme et intensité) et normalisation des différentes sources d'information.
Voir la publication →Estimating acoustic-labial weights in connected speech recognition systems based on HMM
EUROSPEECH 1997
Approche pour pondérer la contribution des sources acoustiques et visuelles dans un système de reconnaissance de parole connectée bimodale. Optimisation des valeurs de pondération pour minimiser le taux d'erreur.
Voir la publication →