Gemini Omni peut créer un film à partir de quasiment n'importe quoi

Publié le: 20/05/2026 @ 14:38:16: Par Nic007 Dans "Google"

Lors de la conférence Google I/O 2026, l'entreprise a dévoilé un nouveau modèle d'intelligence artificielle, Gemini Omni Flash, qu'elle considère comme une avancée majeure dans le développement de l'IA générative. Selon Google, ce système est capable de créer des vidéos de haute qualité à partir de pratiquement n'importe quel type de données d'entrée, qu'il s'agisse de texte, d'images, d'enregistrements audio ou vidéo. Suite au succès du modèle Nano Banana, qui, selon l'entreprise, a déjà généré plus de 50 milliards d'images, Google va beaucoup plus loin cette fois-ci en intégrant tous les médias dans un système d'IA multimodal unique. Gemini Omni Flash permet aux utilisateurs de monter des vidéos à l'aide de simples commandes textuelles. Concrètement, cela signifie ajouter des objets, modifier l'environnement, choisir différents angles de caméra ou encore changer le style de la scène, sans intervention manuelle. Google souligne que le modèle préserve la cohérence des personnages et des séquences, même après de multiples modifications. Il est également possible d'importer ses propres vidéos et de demander à l'IA d'y ajouter des effets spéciaux, de nouveaux personnages ou de modifier complètement l'ambiance.

De plus, la société affirme qu'Omni possède une « compréhension intuitive de la physique » et que le contenu généré s'appuie sur les connaissances historiques, scientifiques et culturelles de Gemini. L'objectif est d'améliorer le réalisme des scènes et la qualité de la narration. Ce nouveau modèle peut générer des tutoriels vidéo complets à partir d'une brève description textuelle, avec une voix off générée automatiquement par IA. Il est possible d'utiliser des photos de personnages, des croquis ou des images de scènes comme données d'entrée. Fait intéressant, Google permettra également la création d'un avatar numérique de l'utilisateur. Ce double virtuel pourra apparaître dans les contenus générés par l'IA, en conservant l'apparence et la voix de son propriétaire. Pour l'instant, Omni prend principalement en charge les échantillons vocaux comme source audio, mais Google annonce qu'il étendra la compatibilité à d'autres formats audio ultérieurement. Il est important de noter que tout le contenu créé par Gemini Omni sera automatiquement marqué d'un filigrane numérique SynthID. Cette technologie permettra également de reconnaître le contenu généré par l'IA dans l'application Gemini, la recherche Google et le navigateur Chrome, entre autres.

Gemini Omni Flash est désormais disponible dans l'application Gemini et Google Flow pour les abonnés Google AI Plus, Pro et Ultra. Il sera également disponible dans YouTube Shorts et l'application YouTube Create, où il permettra de remixer des vidéos courtes.

Intel interrompt la fourniture de ses an... »« Google dévoile Gemini Spark. Il s'agit ...

Plus d'actualités dans cette catégorie

29-05Google Google corrige les limitations de Gemini suite aux plaintes des utilisateurs.

27-05Google Presque tous les Chromecast ont perdu leurs mises à jour, sauf un

21-05Google Google a coupé l'accès au cloud d'un client sans préavis. L'entreprise s'est effondrée du jour au lendemain.

21-05Google Google vient de mettre fin au moteur de recherche classique. Fini les listes de liens, place à l'échange avec l'IA.

20-05Google Google restreint discrètement l'accès gratuit à Gemini. Des utilisateurs découvrent de nouveaux blocages.

Poster un commentaire

Vous devez être identifié pour accéder à cette fonctionnalité

Utilisateur	(Inscription)
Mot de passe