Empathie performative et alignement trompeur
Ce projet vise à atténuer les risques de sécurité liés à l’« empathie performative » des grands modèles de langage par l’élaboration participative de mécanismes réglementaires et de cadres institutionnels.
Ce projet aborde les risques de sécurité associés à l’« empathie performative » des grands modèles de langage. Si l’empathie simulée par l’IA peut améliorer les interactions cliniques, elle comporte un risque d’« alignement trompeur », où une sollicitude artificielle peut instrumentaliser la confiance des patientes et patients et nuire à l’objectivité du jugement médical. Dans le cadre d’expériences à grande échelle, l’équipe isolera les caractéristiques susceptibles d’inspirer une confiance injustifiée et appliquera la théorie de la détection du signal afin de cerner les cas où l’empathie de l’IA compromet la qualité des décisions. À plus longue échéance, ce projet vise l’élaboration participative de garde-fous réglementaires et de cadres institutionnels pour garantir que l’IA reste un outil sûr pour le bien-être des patientes et patients, et non un instrument de manipulation dans le secteur de la santé.
Collaborateurs et collaboratrices
Michael Inzlicht


