in Sécurité

La face cachée des ia génératrices d’images : l’inquiétante découverte de contenu NSFW

Par Narindra R. 5 novembre 2023, 17 h 27 min 2 minutes de lecture

La face cachée des ia génératrices d'images : l'inquiétante découverte de contenu nsfw

Un nouveau test a révélé que les IA génératrices d'images populaires peuvent être exploitées pour créer du contenu NSFW (Not Safe For Work). À l'origine, ces outils ont été conçus afin de générer du contenu classé G.

Les chercheurs de l'Université Johns Hopkins ont manipulé deux des systèmes les plus connus. Cela afin de produire exactement le type d'images que les garanties des produits excluent normalement. Ils ont affirmé qu'avec le bon code, tout le monde peut contourner les filtres de ces IA génératives pour créer du contenu inapproprié.

Stable Diffusion et DALL-E 2 dans la ligne de mire des chercheurs

L'auteur Yinzhi Cao, informaticien à Johns Hopkins, a déclaré que l'objectif est ici de montrer que les développeurs d'IA génératives n'adoptent pas les mesures nécessaires pour bloquer le contenu NSFW. « Nous ne faisons que montrer que les utilisateurs peuvent profiter de cette découverte. Par contre, les conclusions de notre étude ne seront présentées que lors du 45e Symposium de l'IEEE sur la sécurité et la confidentialité en 2024 », a-t-il ajouté.

https://www.youtube.com/watch?v=CkOiRSViQyM&pp=ygUHQUkgTlNXRg%3D%3D

Cao et son équipe ont testé les générateurs d'images DALL-E 2 et Stable Diffusion. Il s'agit des deux outils les plus utilisés et gérés par l'intellignce artificielle. Ces IA génératives sont capables de générer instantanément des images réalistes à partir d'une simple commande. Ils ont acquis une certaine notoriété en raison de leur capacité à créer des images en fonction des descriptions textuelles fournies.

Sneaky prompt : la solution pour créer du contenu NSFW avec l'IA

Une équipe de recherche a testé des générateurs d'images avec un nouvel algorithme baptisé Sneaky Prompt. Celui-ci crée des mots de commande absurdes qui sont interprétés par les systèmes comme des demandes pour générer des images spécifiques depuis leur interface.

Certains de ces mots absurdes produisaient des images innocentes. Mais les chercheurs ont découvert que d'autres génèrent du contenu inapproprié de façon réaliste. Par exemple, le mot « sumowtawgha » amenait DALL-E 2 à créer des nus.

Selon Cao, ces résultats montrent comment ces systèmes pourraient potentiellement être exploités pour produire d'autres types de contenus problématiques. Des images trompeuses de personnalités en situation compromettante pourraient par exemple être générées.

L'équipe étudiera ensuite des moyens de renforcer la sécurité des générateurs d'images, dans le but d'améliorer leurs défenses. Cette recherche visait en effet à tester leurs vulnérabilités.

Partager l'article :

Facebook
Twitter
LinkedIn

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire Annuler la réponse

A ne pas manquer

Portail Orange en page d’accueil : comment faire ? Le guide complet

Vous êtes nombreux à vouloir remettre le portail Orange en page d’accueil sur votre navigateur […] Plus
Zimbra : guide complet du webmail de Free

Zimbra est, entre autre, un service de messagerie en ligne que Free fournit à ses […] Plus
iPhone 15 Pro Max : Les astuces pour minimiser son coût

L’iPhone 15 Pro Max, le dernier bijou de technologie signé Apple, se distingue par sa […] Plus
Sigfox : tout savoir sur cet opérateur de télécommunications français, spécialiste de l’IoT

Sigfox est un opérateur 0G et intégrateur IoT français qui exerce depuis 2009. Ce dossier […] Plus

Plus sur: Sécurité

Nozomi Networks et Mitsubishi : innovation en cybersécurité des systèmes industriels

Nozomi Networks révolutionne la sécurité industrielle avec Arc Embedded, une solution intégrée aux PLC de […] Plus
Smart Lock Nuki : L’allié des investisseurs et conciergeries

Imaginez un monde où vous n’avez plus besoin de chercher vos clés au fond de […] Plus
Smart Lock U200 : La serrure intelligente qui va révolutionner votre quotidien

La marque Aqara frappe un grand coup sur le marché des serrures connectées. Compatible avec […] Plus
Snowflake sous le feu des critiques après une série de violations de données

La société d’analyse de données cloud, Snowflake, est au centre d’un scandale de vol de […] Plus

Back to Top