Quelque 2200 concurrents ont passé la fin de semaine à pianoter sur des ordinateurs portables dans le but d'exposer les failles de différents robots conversationnels issus de l’intelligence artificielle (IA) générative.

Une compétition de trois jours s'est achevée dimanche à Las Vegas lors de DEF CON, la convention de pirates informatiques la plus connue à travers le monde. Les participants ont été mis au défi de cerner les failles de huit robots conversationnels de premier plan, dont le populaire ChatGPT d'OpenAI.

L'équipe rouge, un groupe de pirates informatiques éthiques, a simulé des attaques dans le but d’améliorer la cybersécurité et de cerner les faiblesses des différents programmes.

Kenneth Yeung, étudiant en deuxième année de commerce et d'informatique à l'Université d'Ottawa, explique comment son équipe a tenté de faire générer de fausses informations par les applications, lors de sa participation au Generative Red Team Challenge.

C'est un exercice pour montrer qu'il y a un problème , explique-t-il en entrevue avec CBC/Radio-Canada. Mais si une entreprise recueille suffisamment de données [...], cela lui permettra certainement de s'améliorer d'une certaine manière.

Ouvrir en mode plein écran Kenneth Yeung, étudiant à l'université d'Ottawa, a participé à la convention de hackers à Las Vegas. Photo : Kelly Crummey

Les responsables de la Maison-Blanche, préoccupés par le potentiel de nuisance sociétale des robots conversationnels issus de l’ IA et par les grandes entreprises de la Silicon Valley qui les commercialisent à toute vitesse, se sont fortement investis dans le concours.

Les conclusions de cet exercice ne seront pas rendues publiques avant le mois de février. Il faudra, par la suite, du temps et des millions de dollars pour corriger les défauts repérés par l’équipe rouge.

Des garde-fous nécessaires

Les concurrents de DEF CON sont plus susceptibles de découvrir de nouveaux problèmes, car il s’agit de la sécurité informatique d'il y a 30 ans. Nous trouvons des failles à gauche et à droite , note Bruce Schneier, un technologue de Harvard spécialisé dans les questions d'intérêt public.

Formés en grande partie par l'ingestion et la classification de milliards de données lors de recherches sur l'internet, ChatGPT d'OpenAI et Bard de Google sont en perpétuelle évolution.

Après avoir rendu publics les robots conversationnels à l'automne dernier, le secteur de l' IA générative a dû combler à plusieurs reprises les failles de sécurité révélées par les chercheurs et les internautes.

Il n'y a pas de bons garde-fous , souligne Tom Bonner, de la société HiddenLayer, spécialisée dans la sécurité de l' IA . Un chercheur a demandé à ChatGPT de créer des courriels d'hameçonnage et une recette pour éliminer violemment l'humanité, ce qui constitue une violation de son code d'éthique.

Une équipe comprenant des chercheurs de l'École de science informatique de l’Université de Carnegie Mellon a constaté que les principaux robots conversationnels étaient vulnérables aux attaques automatisées qui produisent également des contenus nuisibles.

Il est possible que la nature même des modèles d'apprentissage profond rende ces menaces inévitables.

Ce n'est pas comme si les alarmes n'avaient pas été tirées. Dans son rapport final de 2021, la Commission nationale de sécurité des États-Unis sur l'intelligence artificielle a déclaré que des attaques contre des systèmes d' IA commerciaux se produisaient déjà et qu' à de rares exceptions près, l'idée de protéger les systèmes a été envisagée après leur mise en œuvre, avec des investissements inadéquats en recherche et développement.

Vulnérabilités des robots conversationnels

Il n'est pas toujours évident pour leurs créateurs de savoir comment les attaques trompent la logique de l'intelligence artificielle, bien que les robots conversationnels soient particulièrement vulnérables.

Le fait d'interagir directement avec eux peut les modifier de manière inattendue. Les chercheurs ont découvert que l'empoisonnement d'une petite collection d'images ou de textes dans la vaste mer de données utilisées pour former les systèmes d'intelligence artificielle peut faire des ravages – et passer inaperçu.

Une étude cosignée par Florian Tramér, de l'université suisse ETH Zurich, a établi que la corruption de seulement 0,01 % d'un modèle suffisait à le gâcher – et ne coûtait que 60 dollars.

Les grands acteurs de l' IA affirment que la sécurité est une priorité absolue et se sont engagés volontairement auprès de la Maison-Blanche, le mois dernier, à soumettre leurs modèles – en grande partie des boîtes noires dont le contenu est tenu secret – à un examen minutieux.

Or, certains craignent que les entreprises n'en fassent pas assez. M. Tramér s'attend à ce que les moteurs de recherche et les plateformes de médias sociaux soient utilisés à des fins financières et de désinformation en exploitant les faiblesses des systèmes d' IA . Un candidat avisé pourrait, par exemple, convaincre un système qu'il est le seul candidat à l’emploi compétent.

Ross Anderson, informaticien à l'université de Cambridge, craint que les robots d' IA portent atteinte à la vie privée, car les gens les utilisent pour interagir avec les hôpitaux, les banques ainsi que leurs employeurs. Des acteurs malveillants les utilisent également pour extraire des données financières, d'emploi ou de systèmes de santé.

Les modèles de langage de l' IA peuvent également se contaminer eux-mêmes en se rééduquant à partir de données inutiles. Une autre préoccupation concerne les secrets d'entreprise ingérés et recrachés par les systèmes d' IA .