Voici un article plus technique que littĂ©raire, mais en tant qu’ingĂ©nieur et auteur de SF, je m’intĂ©resse aux actualitĂ©s et aux problĂ©matiques posĂ©es par l’IA (Intelligence Artificielle). Cet article pose l’importante question du droit Ă la propriĂ©tĂ© intellectuelle de nos amis illustrateurs et graphistes.
âLa problĂ©matique
Pour leur apprentissage, les modĂšles d’Intelligence Artificielle text-to-image (de type Dall-E, Midjourney) ont utilisĂ© des millions dâimages collectĂ©es sur Internet sans se soucier de la propriĂ©tĂ© intellectuelle. Cela peut nuire aux artistes dont le style peut ĂȘtre facilement imité (« Sâil te plait, dessine-moi un mouton dans le style de Banksy » #đ). Par exemple, le prompt ci-dessous inspirĂ© de la TragĂ©die de l’orque plagie une oeuvre bien connue : « reproduis-moi le tableau le cri de Munch, en ajoutant un trou noir qui menace le systĂšme solaire. »

đĄïžLa solution
Des chercheurs de lâuniversitĂ© de Chicago proposent un logiciel (Glaze) qui permet aux artistes de protĂ©ger leurs crĂ©ations dâune telle imitation.
Lâalgorithme modifie de façon imperceptible lâimage (pour lâĆil humain), mais suffisamment pour empoisonner lâapprentissage dâune IA et la leurrer sur ce qui fait la spĂ©cificitĂ© de lâĆuvre : son style distinctif.
âïž Comment ça fonctionne ?
Cela semble magique, tant les modifications sont quasi-invisibles Ă lâĆil nu. LâidĂ©e est de se concentrer sur le style de lâimage, et non les Ă©lĂ©ments reprĂ©sentĂ©s (un chat, un arbre, âŠ) et de leurrer le systĂšme dâapprentissage uniquement sur le style. Le style artistique est par exemple le cubisme, le fauvisme, ou une façon propre Ă lâartiste (par exemple : Ă la mode Van-Gogh).
Mais comment isoler le style dâune image ?
LâidĂ©e est la suivante. ConsidĂ©rons lâĆuvre Ă protĂ©ger x
- Le logiciel créé une nouvelle image de x transformĂ©e dans un style artistique cible (c) trĂšs diffĂ©rent : T(x, c) (par exemple : « mon dessin (x) dans le style de Banksi (c) »)
- Ensuite, il gĂ©nĂšre des micro-variations de x notĂ©es dx qui vont rapprocher x de T(x, c) tout en minimisant lâimpact visuel (utilisation de lâalgo LPIPS Learning Perceptual Image Patch Similarity pour quantifier ces impacts)
- Lâalgo itĂšre en trouvant lâoptimum local = distance minimale : minDist(G(x+dx), G(T(x,c)))
- tout en respectant la contrainte |dx|<p. p Ă©tant le seuil de dĂ©gradation dâimage tolĂ©rĂ©.
- G(x) Ă©tant la gĂ©nĂ©ration text-to-image de lâimage x.
- Lâartiste publie enfin lâimage G(x+dx), qui sera visuellement proche, mais qui ressemblera pour un algo de type stable diffusion Ă un style c.
- Le modĂšle IA qui aura appris sur cette image modifiĂ©e reconnaĂźtra alors plus facilement le style c que le style original. Câest ce que lâon appelle un empoisonnement de modĂšle pendant la phase dâapprentissage.

âïžQuelles contremesures ?
Il est probable que les entitĂ©s impactĂ©es (OpenAI, Stability AI, âŠ) rĂ©agissent et mettent en place des contremesures pour attĂ©nuer lâeffet de tels algorithmes. Par exemple, ajouter du bruit gaussien ou de la compression dâimage.
Les auteurs de lâarticle affirment que lâajout de bruit diminue autant la protection que la qualitĂ© de lâimitation â ce qui est finalement contre-productif pour lâapprentissage.
âïž Les limites de lâapproche
Il y a dĂ©jĂ tant dâĆuvres en accĂšs libre sur Internet, que le mal est dĂ©jĂ fait. Ce procĂ©dĂ© nĂ©cessite la volontĂ© de lâartiste qui doit protĂ©ger lâintĂ©gralitĂ© de ses oeuvres publiĂ©es. Câest compliquĂ©, pour ne pas dire impossible. (Surtout pour les oeuvres publiĂ©es Ă son insu, site de fans, critiques artistiques, etc.)
Ensuite, rien ne garantit quâune parade ne soit pas trouvĂ©e. La protection dâaujourdâhui ne signifie pas la protection de demain, c’est un grand classique en cybersĂ©curitĂ©.
đPour aller plus loin
Si vous voulez creuser le sujet :
- Allez sur leur site https://glaze.cs.uchicago.edu/
- Lisez l’article scientifique qui explique plus en dĂ©tail : http://people.cs.uchicago.edu/~ravenben/publications/pdf/glaze-usenix23.pdf
Laisser un commentaire