
![]() |
Ecole Thématique interdisciplinaire Modèles de langue pour le traitement sémantique et l’intégration de connaissances et données en agriculture, alimentation et environnement Date : du lundi 29 septembre au jeudi 2 octobre 2025 Lieu : le Hameau de l’Etoile Dans le cadre du Plan INRAE Données pour la Science OSD1 - Produire, partage et réutiliser des données pour une recherche ouverte et reproductible |
Pour tout renseignement : ETLMIC@inrae.fr

Consolider nos connaissances dans un maëlstrom d’informations
Jamais nous n’avons eu autant de contenus scientifiques à disposition : publications, bases de données, rapports, pages web, etc. Cette profusion est une chance pour enrichir nos connaissances. Mais elle s’accompagne d’un défi majeur : comment, en dépit d’une grande diversité de sources, extraire, filtrer, structurer, organiser, fiabiliser, et standardiser l’information - souvent redondante, incertaine, voire contradictoire ? Pour répondre à cette question, il est plus que jamais essentiel de s’approprier des méthodes robustes, innovantes ou éprouvées, que ce soit pour la veille bibliographique, l’analyse de corpus spécialisés, la recherche d’information précise, le partage ou la réutilisation.
Croiser les regards, et construire ensemble
A INRAE, nous disposons de compétences variées - Traitement Automatique de la Langue, technologie du web sémantique, informatique, biostatistiques, sciences de la terre et du vivant, sciences humaines et sociales. Mais les méthodes d’analyse automatique de textes qui relèvent des modèles de langue, des graphes de connaissance et de l’extraction d’information restent encore peu partagées entre communautés. L’enjeu de cette école thématique est précisément de (i) faire dialoguer des chercheurs de disciplines différentes ; (ii) prendre conscience de la nécessité de l’interdisciplinarité pour l’adaptation des méthodes ; (iii) faire émerger des projets communs sur des enjeux transversaux stratégiques pour l’Institut.
Concrètement l’école thématique vise à :
• Rendre les bénéfices et les principes des méthodes d’extraction d’information compréhensibles et appropriables par tous les chercheurs et ingénieurs ;
• Faire monter les spécialistes de l’IA au sens très large en compétence théorique et pratique en modèle de langue et représentation des connaissances pour l’extraction d’information textuelle.
Ce que vous saurez faire à la sortie de l’école thématique :
• Maîtriser l’application de modèles de langue à l’extraction d’information pour répondre à des questions scientifiques, voire en faire émerger de nouvelles ;
• Apprendre à adapter les modèles de langue à l’objectif par différentes stratégies et l’apport de connaissances externes (exemples, lexiques, ontologies,…) ;
• Savoir enrichir des ressources partagées (bases de données, graphes de connaissances, ontologies,…) par les informations extraites ;
• Mieux comprendre le potentiel et les limites des outils de traitement automatique ;
• Croiser les concepts et pratiques entre scientifiques de différents domaines ;
• Partager une culture commune des enjeux de traçabilité, de fiabilité, de transparence et de consolidation de la connaissance dans ce cadre ;
• Initier des collaborations sur des problématiques prioritaires pour INRAE, au travers des travaux pratiques et mini-projets concrets.
