Publié le: 21/09/2023 @ 15:28:25: Par Nic007 Dans "Programmation"
OpenAI a annoncé DALL-E 3 , la troisième version de son générateur d'images à partir de texte, et la grande nouveauté est l'intégration avec ChatGPT pour obtenir des résultats beaucoup plus proches de ce que vous avez en tête. Mais surtout, la frontière entre les deux outils s'estompe : est-ce DALL-E 3 qui intègre ChatGPT ou ChatGPT qui peut désormais créer des images grâce à DALL-E 3 ? Question existentialiste mise à part, le nouveau système d'image à partir de texte tend à résoudre un problème de longue date non seulement avec DALL-E mais avec tous ces outils d'IA générative : l'insertion de texte suffisamment détaillé , souvent très long, pour expliquer l'image. générateur de ce que nous avons en tête (le contexte). En fait, DALL-E, comme tous les modèles d'intelligence artificielle , fonctionne beaucoup mieux avec des invites textuelles détaillées, souvent très longues, à tel point que ceux qui l'utilisent désormais pour le travail ont dû se spécialiser dans la compréhension de sa dynamique pour modifier les paramètres et les poids du modèle . Désormais, grâce à l'intégration avec ChatGPT, vous n'avez plus besoin d'utiliser ce système, car vous pouvez simplement demander à ChatGPT de générer une invite, après quoi le chatbot populaire écrira un texte pour DALL-E.
À ce stade, DALL-E 3, comme auparavant, vous proposera quatre images basées sur cette invite qui devraient être plus conformes aux pensées de l'utilisateur et selon OpenAI , cela permettra à plus de personnes de créer de l'art IA car il n'est pas nécessaire d'être particulièrement doué pour trouver une invite. Évidemment, ceux qui ont des besoins plus spécifiques pourront continuer à utiliser le système précédent. L'entreprise a ensuite expliqué qu'elle avait accordé beaucoup d'attention aux mesures de sécurité pour empêcher la création d' images obscènes ou susceptibles d'offenser la sensibilité des utilisateurs, en travaillant avec des groupes externes spécialisés dans la sape d'un système pour tester sa sécurité. De plus, des classificateurs d'entrée ont été utilisés pour apprendre aux modèles de langage à ignorer certains mots afin d'éviter les demandes explicites ou violentes. DALL-E 3 ne sera pas non plus en mesure de recréer des images de personnalités publiques , tant que l'invite mentionne spécifiquement un nom. Cependant, les développeurs préviennent que l'outil n'est pas encore parfait. Une autre question cruciale concerne le droit d’auteur. D'autres générateurs d'images comme Stable Diffusion et Midjourney ont été dénoncés par des artistes pour avoir imité leur style, et OpenAI permettra aux artistes de demander que leurs images ne soient pas incluses dans les futures versions de modèles d'images à partir de texte. Ce qui est curieux : c'est un artiste qui doit télécharger son image sur le site OpenAI et demander sa suppression, et non OpenAI qui demande à l'artiste l'autorisation de l'utiliser.
Cependant, contrairement à DALL-E 2 qui pouvait imiter le style des artistes sur demande, DALL-E 3 a été formé pour refuser de générer des images dans le style des artistes vivants. DALL-E 3 est actuellement en développement et sera d'abord publié pour les utilisateurs de ChatGPT Plus et ChatGPT Enterprise en octobre, et arrivera dans les laboratoires de recherche et son service API à l'automne. Comme nous le voyons, à ce stade, ChatGPT et DALL-E sont de plus en plus interconnectés, et il semble que pour le moment, le nouveau générateur d'images utilise le modèle GPT-4 car une version publique gratuite n'a pas été annoncée.
À ce stade, DALL-E 3, comme auparavant, vous proposera quatre images basées sur cette invite qui devraient être plus conformes aux pensées de l'utilisateur et selon OpenAI , cela permettra à plus de personnes de créer de l'art IA car il n'est pas nécessaire d'être particulièrement doué pour trouver une invite. Évidemment, ceux qui ont des besoins plus spécifiques pourront continuer à utiliser le système précédent. L'entreprise a ensuite expliqué qu'elle avait accordé beaucoup d'attention aux mesures de sécurité pour empêcher la création d' images obscènes ou susceptibles d'offenser la sensibilité des utilisateurs, en travaillant avec des groupes externes spécialisés dans la sape d'un système pour tester sa sécurité. De plus, des classificateurs d'entrée ont été utilisés pour apprendre aux modèles de langage à ignorer certains mots afin d'éviter les demandes explicites ou violentes. DALL-E 3 ne sera pas non plus en mesure de recréer des images de personnalités publiques , tant que l'invite mentionne spécifiquement un nom. Cependant, les développeurs préviennent que l'outil n'est pas encore parfait. Une autre question cruciale concerne le droit d’auteur. D'autres générateurs d'images comme Stable Diffusion et Midjourney ont été dénoncés par des artistes pour avoir imité leur style, et OpenAI permettra aux artistes de demander que leurs images ne soient pas incluses dans les futures versions de modèles d'images à partir de texte. Ce qui est curieux : c'est un artiste qui doit télécharger son image sur le site OpenAI et demander sa suppression, et non OpenAI qui demande à l'artiste l'autorisation de l'utiliser.
Cependant, contrairement à DALL-E 2 qui pouvait imiter le style des artistes sur demande, DALL-E 3 a été formé pour refuser de générer des images dans le style des artistes vivants. DALL-E 3 est actuellement en développement et sera d'abord publié pour les utilisateurs de ChatGPT Plus et ChatGPT Enterprise en octobre, et arrivera dans les laboratoires de recherche et son service API à l'automne. Comme nous le voyons, à ce stade, ChatGPT et DALL-E sont de plus en plus interconnectés, et il semble que pour le moment, le nouveau générateur d'images utilise le modèle GPT-4 car une version publique gratuite n'a pas été annoncée.
Liens
Lien (721 Clics)
Plus d'actualités dans cette catégorie