La robustesse antagoniste de la sécurité des GML

Mettre au point un modèle d’attaque automatisé performant pour optimiser l’évaluation et l’entraînement des grands modèles de langage en vue de les rendre plus sûrs et plus robustes.

Projet Catalyseur | 11 avril 2026

Abstract background with geometric shapes

L’évaluation des vulnérabilités des grands modèles de langage (GML) est devenue un domaine clé de la recherche sur la sécurité de l’IA. Gauthier Gidel, titulaire de chaire en IA Canada-CIFAR, propose une méthode novatrice, plus efficace et automatisée, pour trouver les vulnérabilités dans les GML. En faisant appel à l’optimisation et en empruntant des méthodes issues d’attaques antagonistes fondées sur les images, ce projet a pour but de fournir un modèle efficace d’attaque automatique. Cela permettra aux concepteurs et conceptrices de modèles d’améliorer les évaluations et l’entraînement des GML, de mesurer leur vulnérabilité, ainsi que de les rendre plus sûrs et plus robustes.

Collaborateurs et collaboratrices

Gauthier Gidel
Mila et Université de Montréal

Recherches associées

Projet Catalyseur

La robustesse antagoniste de la sécurité des GML

Collaborateurs et collaboratrices

Recherches associées

Fondements économiques de l’homologation de l’IA

Formalisation des contraintes pour l’évaluation et l’atténuation du risque agentique

La robustesse antagoniste dans les graphes de connaissances