Pour information
L'argumentaire ci-dessous a été rédigé par les organisateurs de la conférence pour introduire la table ronde et non par les intervenant:e:s listé:e:s ci-dessus. L'argumentaire n'engage donc pas leur responsabilité scientifique.
Argumentaire
Le terme « Intelligence artificielle » est très largement utilisé à l'heure actuelle et remplace dans bien des cas les termes plus précis d'apprentissage automatique (machine learning) qui donne la capacité d'apprendre à partir de données et, en particulier, de l'apprentissage supervisé, dans le cas où les données sont déjà annotées.
Pourtant, la plupart des domaines couverts par le périmètre d'intérêt de Biblissima+ sont considérés comme des domaines à faibles ressources (low-resource domain). Non seulement les corpus, même quand ils sont exhaustifs, y sont d'une taille souvent très inférieure à ceux utilisés dans les grands développements des dernières années, mais en outre les annotations disponibles, nécessaires à l'entraînement, sont en plus faible nombre encore. La production et la validation de nouvelles annotations dans ces domaines spécifiques nécessitent enfin des personnes qualifiées à haut niveau d'expertise.
Ici peut-être plus qu'ailleurs, le désir d'une « intelligence artificielle hybride » se fait sentir, qui combinerait les avantages de l'IA symbolique, fondée sur des règles, et de l'IA sub-symbolique, peu transparente et gourmande en données. L'enjeu pourrait être d'intégrer la logique d'ensemble formalisée par des générations de chercheur:se:s, avec leur connaissance implicite de leur domaine de spécialité, tout en étant assez souples pour accueillir l'infinie diversité des situations constatées dans les sources patrimoniales.
Pour discuter de l'applicabilité de l'intelligence artificielle dans les domaines des SHS couverts par Biblissima+, trois intervenants seront interrogés.
Intervenants
Bertrand Coüasnon est maître de conférences (HDR) en informatique à l'INSA Rennes et membre de l'IRISA. Il travaille sur la formalisation des connaissances, les méthodes génériques de reconnaissance de la structure des documents, la reconnaissance de l'écriture manuscrite, l'interaction utilisateur, l'apprentissage avec peu de données annotées, la combinaison apprentissage profond et méthodes syntaxiques, les systèmes auto-adaptatifs, avec des applications sur des documents d'archives et des documents complexes.
Benjamin Kiessling, ingénieur de recherche PSL, développe kraken, le module HTR (handwritten text recognition) au coeur des développements de la plateforme de transcription automatique des documents manuscrits eScriptorium.
Thierry Paquet est professeur à l'université de Rouen et membre du laboratoire LITIS (EA 4108). Il est spécialiste en reconnaissance de l'écriture manuscrite, en reconnaissance de formes pour données séquentielles, en analyse et reconnaissance d'images de documents et des modèles probabilistes et réseaux de neurones.