Publié le: 24/02/2025 @ 14:16:29: Par Nic007 Dans "Programmation"

Plus précisément, vous pouvez voir l'agent répondre aux demandes de ses créateurs et trouver une vidéo sur YouTube ou localiser une recette de cocktail au whisky dans une application de cocktail, rassembler les ingrédients, puis les ajouter à une liste de courses sur Google Keep. Il est également montré comment l'agent est capable de télécharger un jeu Android, « 2048 », et même de comprendre comment y jouer. C’est un moment particulièrement intéressant dans la vidéo, quelque peu paradigmatique de l’industrie de l’IA à l’heure actuelle. Une fois l'application téléchargée et lancée, les deux développeurs se demandent si l'agent IA qu'ils ont créé apprendra ou non à l'utiliser grâce au tutoriel initial . « Ce serait fascinant », commentent-ils, mais au vu de l’invite, ils ne pensent pas qu’il ferait ça. En réalité, l'IA passe ensuite par le tutoriel et apprend à jouer de cette façon. Chaque jour, j’écris sur l’IA, j’utilise l’IA et je me bats avec l’IA, et ces situations ne cessent de m’émerveiller.
Le modèle semble faire plus ou moins tout ce qu'on lui demande, mais il n'est qu'une « pièce passionnante du puzzle » sur la route vers le LAM promis. Non seulement cela, mais c'est le « cycle d'action principal qu'un agent Android est capable de compléter », admettant qu'« il y a de nombreuses optimisations à faire sur la vitesse, l'intelligence et la disponibilité de la reconnaissance d'état ». D’autres mises à jour sur le prochain système multi-agent multiplateforme de la société seront partagées dans les semaines à venir. Ce qui signifie que tôt ou tard tout ce travail sera intégré comme promis dans le Rabbit R1 .
