Les études en intelligence artificielle sont un domaine particulièrement actif, toujours ouvert aux nouveautés et aux innovations. Elles vont des générateurs de texte , dans certains cas presque indiscernables de ceux créés par les humains, aux générateurs de musique et même aux œuvres d'art (également vendues aux enchères). Le mois dernier OpenAI a dévoilé DALL-E 2 un programme d'intelligence artificielle qui crée des images photoréalistes à partir de descriptions textuelles et Google a mis en place sa propre version, baptisée Imagen. Comme l'a déclaré Jeff Dean , responsable de l'intelligence artificielle chez Google, Imagen augmente la taille des modèles de langage génériques , afin d'augmenter à la fois la fidélité de l'échantillon et l'alignement de l'image texte, et les résultats sont incroyables.
Google a testé son programme à travers un benchmark pour évaluer les modèles texte-image appelé DrawBench . Les évaluateurs humains ont préféré "Imagen aux autres modèles dans les comparaisons côte à côte, à la fois en termes de qualité de l'échantillon et d'alignement image-texte". Malheureusement, le problème est toujours le même : comment l'IA s'entraîne -t-elle ( vous vous souvenez de Meta ?). En fait, Google n'a pas publié Imagen car s'appuyant sur des encodeurs de texte entraînés sur des données non traitées à l'échelle du Web, il hérite des préjugés sociaux et des limites des grands modèles de langage. Si vous voulez tout de même vous amuser, voici la démo du projet :
https://gweb-research-imagen.appspot.com/#:~:text=State2Dthe20text2Dimage
Google a testé son programme à travers un benchmark pour évaluer les modèles texte-image appelé DrawBench . Les évaluateurs humains ont préféré "Imagen aux autres modèles dans les comparaisons côte à côte, à la fois en termes de qualité de l'échantillon et d'alignement image-texte". Malheureusement, le problème est toujours le même : comment l'IA s'entraîne -t-elle ( vous vous souvenez de Meta ?). En fait, Google n'a pas publié Imagen car s'appuyant sur des encodeurs de texte entraînés sur des données non traitées à l'échelle du Web, il hérite des préjugés sociaux et des limites des grands modèles de langage. Si vous voulez tout de même vous amuser, voici la démo du projet :
https://gweb-research-imagen.appspot.com/#:~:text=State2Dthe20text2Dimage
Plus d'actualités dans cette catégorie