- Accueil
- Techno
- Intelligence artificielle
ChatGPT bientôt doté de la parole et de la vision

L'arrivée de ChatGPT en novembre 2022 a enclenché une course effrénée à l'intelligence artificielle générative.
Photo : iStock / lerbank
OpenAI a indiqué lundi qu'elle allait doter son programme d'intelligence artificielle (IA) ChatGPT de la parole et de la vision pour le rendre « plus intuitif ».
L'interface qui a rendu populaire l'
IA générative (capable de produire du texte, des images et d'autres contenus sur simple demande en langage courant) pourra ainsi bientôt traiter des requêtes contenant des images et aussi discuter oralement avec ses utilisateurs et utilisatrices.Les internautes pourront, par exemple, prendre une photo d'un monument et avoir une conversation avec ChatGPT
sur l'histoire du bâtiment, ou encore montrer au logiciel ce qu'il y a dans leur frigo pour qu'il leur propose une recette, d’après ce que suggère OpenAI dans un communiqué.
Ces nouveaux outils seront déployés dans les deux prochaines semaines pour les membres du service payant ChatGPT Plus, ou encore pour les organisations clientes du service.
L'entreprise avait annoncé l'ajout à venir de telles fonctionnalités en mars dernier, au moment de la présentation de GPT-4, la plus récente version de son modèle de langage. (nouvelle fenêtre)
GPT-4 est multimédia, au sens où il peut traiter des données autres que du texte ou du code informatique.
Des risques d’hallucinations
encore présents
Le succès de ChatGPT depuis la fin 2022 a entraîné une course majeure à l'
IA générative entre les géants des technologies, Google et Microsoft en tête.Toutefois, le déploiement à toute vitesse de ces programmes encore très peu régulés suscite aussi beaucoup d'inquiétudes, d'autant qu'ils ont tendance à halluciner
, c'est-à-dire à inventer des réponses de toutes pièces.
Les modèles dotés de la vision présentent de nouveaux défis
, reconnaît OpenAI dans un communiqué. Parmi ceux-ci, l'entreprise note les hallucinations qu'ils peuvent avoir, mais aussi le risque de faire confiance à l'interprétation des images par le modèle dans des domaines aux enjeux importants
.
L'entreprise émergente assure avoir testé le modèle
sur des sujets tels que l'extrémisme et les connaissances scientifiques, et compte sur les usages dans la vie réelle et les rétroactions des internautes pour s'améliorer.
Elle a en outre limité les capacités de ChatGPT à analyser les personnes
, car l'interface n'est pas toujours précise et ces systèmes doivent respecter la confidentialité des individus
.
Spotify s’allie à OpenAI
La plateforme de diffusion en continu Spotify a par ailleurs annoncé lundi un partenariat avec OpenAI pour traduire les balados directement avec de l'
IA.Des émissions enregistrées en anglais seront désormais offertes dans d'autres langues tout en conservant les caractéristiques vocales distinctives du locuteur ou de la locutrice
, a indiqué le service dans un communiqué.
L'entreprise suédoise assure que la nouvelle technologie de génération de voix d'OpenAI reproduit le style de l'orateur ou de l’oratrice d'origine, ce qui permet une expérience d'écoute plus authentique, plus personnelle et plus naturelle que le doublage traditionnel
.
À lire aussi :
- OpenAI dévoile DALL-E 3, son plus récent générateur d’images d’IA (nouvelle fenêtre)
- Microsoft intégrera à Bing le nouveau générateur d’images d’OpenAI (nouvelle fenêtre)
- Amazon investit massivement dans l’IA d’Anthropic (nouvelle fenêtre)
- Le créateur de Game of Thrones poursuit OpenAI pour violation du droit d’auteur (nouvelle fenêtre)