Google présente Gemini 3, le modèle d’IA qui continue le défi contre ChatGPT : les fonctionnalités

Alexis Tremblay
Alexis Tremblay

Google a officiellement publié Gémeaux 3une mise à jour qui marque un nouveau chapitre dans la compétition pour la suprématie de l’IA, positionnée comme une réponse directe aux récents lancements d’OpenAI et d’Anthropic. Nous parlons du modèle le plus sophistiqué jamais créé par les laboratoires de Mountain View, conçu non seulement pour discuter sous forme de texte avec l’utilisateur mais pour agir comme «un véritable partenaire de réflexion», pour reprendre l’expression utilisée par Google dans son communiqué officiel. La grande innovation réside dans la diversification de l’offre : d’une part vous avez Gémeaux 3 Prodéjà disponible, optimisé pour la compréhension et la rapidité multimodales ; par contre il arrivera sous peu Gémeaux 3 Réflexion profondeune variante dotée de profondes capacités de raisonnement pour résoudre des problèmes scientifiques et mathématiques complexes. Regardons-les de plus près fonctionnalités de Gemini 3.

Les caractéristiques de l’IA Gemini 3

Pour entrer dans le vif du sujet, sachez que Gemini 3 Pro représente un saut générationnel par rapport à la version 2.5le surpassant dans toutes les mesures importantes. Le modèle atteint le sommet du classement LMArena avec un Score Elo de 1501 (un système d’évaluation comparative basé sur les préférences humaines), mais ce qui est le plus surprenant c’est son performance à des tests académiques rigoureux. Dans le benchmark Le dernier examen de l’humanitéconçu pour tester le raisonnement de niveau expert, le modèle a atteint le 37,5% sans l’aide d’outils externes, détachant les précédents détenteurs de records. En traduisant les chiffres de référence en aspects plus concrets, tout cela signifie que le nouveau modèle de Google peut gérer des nuances complexes, abandonnant les réponses clichées et flatteuses typiques des chatbots précédents au profit d’une réponse plus directe, factuelle et, si nécessaire, critique. Son caractère multimodal a encore été affiné : il ne se contente pas de lire des textes, mais est également capable de traiter vidéo, audio Et Images avec une précision sans précédent, comme le démontre la partition de87,6% sur Vidéo-MMMU.

Pour ceux qui recherchent des performances encore plus élevées, il existe le mode Réflexion profonde par Gemini 3qui sera disponible pour les abonnés au plan Ultra après des tests de sécurité supplémentaires. Conçu pour « réfléchir » avant de répondre, ce mode a obtenu des résultats très intéressants dans plusieurs benchmarks. Dans l’essai ARC-AGIqui évalue la capacité à résoudre des problèmes jamais vus auparavant, atteint le 45,1%une valeur qui indique une capacité d’abstraction et de généralisation qui commence à simuler la pensée humaine déductive. Imaginez pouvoir fournir au modèle des leçons vidéo entières ou des articles académiques complexes : Deep Think ne se contentera pas de les résumer, mais pourra générer des visualisations de données, des flashcards interactifs ou des plans d’études personnalisés, agissant comme une sorte de tuteur universitaire dédié.

Google a introduit le concept de ambiance et codage agentune méthodologie qui permet de développer des logiciels basés davantage sur l’intention et la description naturelle que sur une syntaxe rigide, confiant à l’IA la tâche de traduire l’idée en code fonctionnel. Pour soutenir cette vision est né Google Antigravitéune plateforme de développement d’agents dont Google parlait en ces termes :

Google Antigravity transforme l’assistance IA d’un outil dans la boîte à outils d’un développeur à un partenaire actif. Bien que le cœur de Google Antigravity soit une expérience familière d’IA IDE, ses agents ont été élevés au rang d’interface dédiée et ont accès directement à l’éditeur, au terminal et au navigateur. Désormais, les agents peuvent planifier et exécuter de manière autonome des tâches logicielles complexes de bout en bout en votre nom, tout en validant leur propre code.

Ces capacités agentiques, la capacité de l’IA à agir comme une entité autonome poursuivant un objectif, s’étendent bien au-delà de la programmation. Grâce à une meilleure planification à long terme, vérifiée par benchmark Banc de vente 2 (une simulation de gestion de ressources complexe), il semble que Gemini 3 puisse gérer des tâches quotidiennes complexes. Cela signifie que, juste pour donner un exemple banal, il sera possible de lui déléguer la gestion de votre propre compte. e-mail sur Gmail, lui demandant non seulement de lire, mais aussi d’organiser et de répondre aux messages ou, autre exemple, de planifier des itinéraires de voyage complexe en croisant des données provenant de différentes sources. L’objectif est donc de faire passer l’interaction de l’insertion d’une invite à la délégation d’une tâche complexe.

La question de la sécurité et de la fiabilité du « modèle le plus intelligent » de Google.

Un aspect que Google a fortement souligné concerne la sécurité et fiabilité du modèle. Dans un paysage où les hallucinations de l’IA restent un problème, Gemini 3 a montré des progrès lors du test SimpleQA Vérifiéatteignant l’exactitude factuelle de 72,1%. De plus, le modèle a été formé pour mieux résister à « l’injection rapide »une technique utilisée par les cybercriminels pour inciter l’IA à effectuer des actions inattendues (un type de cyberattaque de plus en plus insidieux), mais aussi pour éviter la complaisanceou la tendance de l’IA à confirmer les opinions de l’utilisateur même lorsqu’elles sont incorrectes. Puisque tous les tests auxquels nous avons fait référence ont été effectués en interne par Google, nous devrons tester le nouveau Gemini 3 sur le terrain pour voir si le modèle a reçu toutes les améliorations dont nous avons parlé et qui, du moins sur le papier, semblent assez succulentes.