Publié le: 20/05/2026 @ 14:38:16: Par Nic007 Dans "Google"
GoogleLors de la conférence Google I/O 2026, l'entreprise a dévoilé un nouveau modèle d'intelligence artificielle, Gemini Omni Flash, qu'elle considère comme une avancée majeure dans le développement de l'IA générative. Selon Google, ce système est capable de créer des vidéos de haute qualité à partir de pratiquement n'importe quel type de données d'entrée, qu'il s'agisse de texte, d'images, d'enregistrements audio ou vidéo. Suite au succès du modèle Nano Banana, qui, selon l'entreprise, a déjà généré plus de 50 milliards d'images, Google va beaucoup plus loin cette fois-ci en intégrant tous les médias dans un système d'IA multimodal unique. Gemini Omni Flash permet aux utilisateurs de monter des vidéos à l'aide de simples commandes textuelles. Concrètement, cela signifie ajouter des objets, modifier l'environnement, choisir différents angles de caméra ou encore changer le style de la scène, sans intervention manuelle. Google souligne que le modèle préserve la cohérence des personnages et des séquences, même après de multiples modifications. Il est également possible d'importer ses propres vidéos et de demander à l'IA d'y ajouter des effets spéciaux, de nouveaux personnages ou de modifier complètement l'ambiance.



De plus, la société affirme qu'Omni possède une « compréhension intuitive de la physique » et que le contenu généré s'appuie sur les connaissances historiques, scientifiques et culturelles de Gemini. L'objectif est d'améliorer le réalisme des scènes et la qualité de la narration. Ce nouveau modèle peut générer des tutoriels vidéo complets à partir d'une brève description textuelle, avec une voix off générée automatiquement par IA. Il est possible d'utiliser des photos de personnages, des croquis ou des images de scènes comme données d'entrée. Fait intéressant, Google permettra également la création d'un avatar numérique de l'utilisateur. Ce double virtuel pourra apparaître dans les contenus générés par l'IA, en conservant l'apparence et la voix de son propriétaire. Pour l'instant, Omni prend principalement en charge les échantillons vocaux comme source audio, mais Google annonce qu'il étendra la compatibilité à d'autres formats audio ultérieurement. Il est important de noter que tout le contenu créé par Gemini Omni sera automatiquement marqué d'un filigrane numérique SynthID. Cette technologie permettra également de reconnaître le contenu généré par l'IA dans l'application Gemini, la recherche Google et le navigateur Chrome, entre autres.

Gemini Omni Flash est désormais disponible dans l'application Gemini et Google Flow pour les abonnés Google AI Plus, Pro et Ultra. Il sera également disponible dans YouTube Shorts et l'application YouTube Create, où il permettra de remixer des vidéos courtes.
Poster un commentaire
Vous devez être identifié pour accéder à cette fonctionnalité

Utilisateur
Mot de passe
 
Informaticien.be - © 2002-2026 Akretio SRL  - Generated via Kelare Haut de page