Meilleures Actions
Histoires Web vendredi, janvier 31
Bulletin

L’un des grands jeux, avec les agents conversationnels à la ChatGPT, Copilot ou Gemini, est de réussir à les faire déraper. C’est-à-dire leur faire dire ce que leurs créateurs voudraient interdire (des insultes, des propos racistes, homophobes…), les contraindre à avouer des informations personnelles, ou encore les convaincre de proposer à l’utilisateur de faux messages commerciaux… Cette activité a été surnommée jailbreaking ou « évasion des barrières », parfois encore « piratage ».

Trois chercheurs, de l’université de Copenhague, de l’université de Californie à Berkeley et de l’entreprise Nvidia ont tenté de mieux comprendre les motivations de celles et surtout de ceux qui s’en prennent à ces nouvelles technologies. Dans la revue PLOS One, le 15 janvier, ils livrent leurs conclusions, reposant sur 28 entretiens avec des auteurs de jailbreaking menés entre décembre 2022 et janvier 2023, soit quelques mois après le lancement de ChatGPT.

Si la plupart ont un emploi, ce n’est pas forcément dans le domaine de la sécurité informatique. Artiste, designer de jeux vidéo, enseignant, étudiant, chercheur…, l’un d’entre eux était même employé chez un semencier. « Aujourd’hui, la majorité ont rejoint les équipes de sécurité de grands fournisseurs de ces services, ce qu’on appelle les “équipes rouges”, chargées d’améliorer la sécurité des systèmes en les attaquant », indique Nanna Inie, professeure à l’université de Copenhague. Un de ses collègues, Leon Derczynski, a été embauché par Nvidia depuis. La plupart se définissent comme « membres d’une équipe rouge » (professionnelle ou non), « jailbreakers », « ingénieurs de prompts » (le « prompt » est la consigne écrite donnée au chatbot pour obtenir la réponse) ou même comme « joueurs ». Jamais « pirates », ni « hackeurs ».

Seules quatre femmes figurent parmi les personnes interviewées. « C’est habituel en informatique. Mais nous avions contacté douze femmes, dont la majorité ont décliné, victimes sans doute de ce qu’on appelle l’“impôt des minorités”. Ces femmes sont sans doute trop sollicitées », relève Nanna Inie.

Il vous reste 58.88% de cet article à lire. La suite est réservée aux abonnés.

Share.
© 2025 Mahalsa France. Tous droits réservés.