Dall-E 3 d'OpenAI : une solution transparente Fusion de l'Art et de l'IA

Le 21 septembre 2023

OpenAI a récemment dévoilé De E 3, la dernière version de son outil artistique basé sur l'intelligence artificielle. Cette technologie de pointe exploite les capacités du célèbre chatbot d'OpenAI, Chat, pour faciliter la création de chefs-d'œuvre visuels plus complexes et artistiquement composés.

Dall-E 3 se distingue de ses prédécesseurs en simplifiant le processus d'amélioration des invites textuelles intégrées au système, une pratique appelée « ingénierie des invites ». En permettant ces améliorations via l'interface conversationnelle de Chat, Dall-E 3 a simplifié la création d'illustrations IA sophistiquées tout en maintenant OpenAI en tête de l'innovation en IA.

L'intégration du Chat avec Dall-E 3 a permis de transformer de brèves invites en instructions plus détaillées pour la composition d'images. Cette évolution représente une avancée significative pour Dall-E et pour l'art génératif par IA dans son ensemble.

Introduit en 2021 et lancé en 2022, Dall-E combine un algorithme entraîné sur de grandes quantités d'images étiquetées provenant du Web et d'autres sources avec un modèle de diffusion pour prédire comment restituer une image pour une invite donnée. Avec des données substantielles, il peut produire des images complexes, cohérentes et esthétiquement attrayantes. Cependant, Dall-E 3 introduit un changement crucial dans la façon dont les humains et les machines interagissent.

Par exemple, Dall-E 3 a rendu cette image en réponse à l'invite « Une illustration d'un cœur humain en verre translucide, debout sur un piédestal au milieu d'une mer agitée... », prouvant que Chat peut prendre en charge le travail de création d'une invite plus sophistiquée, qui nécessiterait autrement une ingénierie d'invite approfondie.

De plus, Dall-E 3 permet aux utilisateurs d'affiner leurs créations via Chat, un peu comme s'ils demandaient des modifications à un artiste. Comme l'explique Aditya Ramesh, chercheur principal et responsable de l'équipe Dall-E : « Vous pouvez simplement interagir avec Chat comme si vous parliez à un collègue. »

Le lancement de Dall-E 3 intervient au milieu d’un boom plus large de l’IA générative qui a commencé en 2022, avec de nombreux générateurs d’art IA prenant le devant de la scène. Bien que ces outils aient suscité un financement et un intérêt public importants, des inquiétudes ont été soulevées quant au déplacement potentiel d’artistes humains et à l’utilisation de matériel protégé par le droit d’auteur pour entraîner des algorithmes d’IA.

En réponse, OpenAI a mis en place des mesures permettant aux artistes de choisir de ne pas utiliser leurs œuvres lors de futures sessions de formation. De plus, Dall-E 3 est conçu pour empêcher les utilisateurs de tenter de générer des œuvres dans le style d'artistes renommés.

OpenAI a également répondu aux préoccupations concernant la génération de contenu inapproprié ou violent, en mettant en place des mesures de protection pour bloquer de telles tentatives. Selon Sandhini Agarwal, chercheuse en politique chez OpenAI, Dall-E 3 a fait l’objet d’une « équipe rouge » approfondie pour garantir la solidité de ses mesures de protection.

Alors que l’art généré par l’IA continue de faire des vagues sur les réseaux sociaux, Dall-E 3, avec l’aide de Chat, est prêt à contribuer à ce paysage numérique dynamique, créant des images surréalistes mais captivantes à partir de simples invites de texte.