•  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Nvidia transforme des croquis en images photoréalistes grâce à l’IA

Une capture d'écran du logiciel conçu par Nvidia dans lequel un croquis simpliste est affiché à gauche et un décor réaliste de deux rochers dans la mer est affiché à droite.
Le système est même capable de générer des réflexions dans l'eau. Photo: Nvidia
Radio-Canada

Imaginez un arbre isolé à contre-jour d'un coucher de soleil sur une péninsule s'étirant à l'horizon. Une photo de cet arbre existe, mais l'arbre, lui, n'existe pas. La photo a été créée par un algorithme mis au point par Nvidia permettant à quiconque de transformer un croquis en une image photoréaliste.

Le système, baptisé GauGAN, est d’une simplicité désarmante, compte tenu de la complexité de l’opération. Pour générer un décor réaliste, il suffit de tracer des formes dans un éditeur ressemblant au logiciel Microsoft Paint. Une grande masse bleu foncé pour l’eau, une forme brune pour la terre et l’arbre, du bleu pâle pour le ciel et quelques formes grises pour les nuages.

La « photo » du décor que vous aviez en tête prend alors vie sous vos yeux en temps réel, grâce à un algorithme entraîné sur plus de 1 million de photos véritables.

Une image montrant différentes images générées par ordinateur d'un armbre pendant un coucher de soleil.L'algorithme conçu par Nvidia est capable de générer des images d'un réalisme impressionnant à partir de croquis simplistes. Photo : Nvidia

Le système ajuste même l’éclairage ou l’allure des différents éléments qui composent l’image selon les changements qui y sont apportés. Par exemple, si vous remplacez l’herbe par de la neige, la couleur des nuages changera pour ressembler davantage à un ciel hivernal.

Une image unique à tout coup

Cette prouesse technologique est rendue possible grâce à un réseau antagoniste génératif, un type d’algorithme d’apprentissage non supervisé particulièrement doué dans la génération d’images photoréalistes.

Le vice-président de l’apprentissage profond appliqué à Nvidia Bryan Catanzaro a expliqué à ZDNet que GauGAN se base sur ses connaissances obtenues en étudiant sa banque de données pour imaginer ses propres décors et qu’il ne s’agit donc pas d’un simple copier-coller de photos existantes.

Cela signifie que, si deux utilisateurs dessinaient exactement le même croquis, ils obtiendraient tout de même deux photos différentes.

Un système encore imparfait

Dans les photos et les vidéos mises en ligne par l’entreprise, les résultats sont impressionnants, quoique imparfaits. Un coup d'œil rapide peut laisser croire qu’il s’agit de véritables photos, mais on remarque vite certains artefacts lorsqu’on s’y attarde. Des parties des décors semblent reproduites à plusieurs reprises dans les images, tandis que les frontières entre les différents éléments (eau, terre, ciel, etc.) sont floues et ne paraissent pas naturelles.

Nvidia compte améliorer GauGAN pour graduellement réduire, voire éliminer ces imperfections.

L’entreprise voudrait un jour offrir cet outil sur son site web pour que tout le monde puisse l’utiliser tout en lui fournissant des données d’utilisation pour améliorer ses performances.

D’ici là, GauGAN devrait être utile aux architectes, aux urbanistes et aux concepteurs de jeux vidéo désirant générer rapidement des images de synthèse pour leurs productions.

Avec les informations de TechCrunch, et ZDNet

Intelligence artificielle

Techno