ce que la nouvelle IA peut faire et comment elle est formée

Crédits : Google.

Pendant l'événement Google E/S qui s'est tenue hier à Mountain View, Google a annoncé diverses nouvelles intéressantes concernant le secteur de l'intelligence artificielle, ouvrant le rideau sur de nouveaux outils, dont Gémeaux 1.5 Flash, le dernier modèle de la famille Gemini entièrement axé sur la vitesse et l'efficacité. Le modèle IA sera intégré à Android 15 (la prochaine version du système d'exploitation mobile de Google) avec diverses fonctionnalités supplémentaires. De plus, « Big G » a annoncé la disponibilité de Gémeaux 1.5 Pro sur différents marchés, dont celui italien. Parmi les nouveautés annoncées à Google I/O, on distingue également Ouaistechnologie texte en vidéo qui « défie » Sora d’OpenAI.

Ce que Gemini 1.5 Flash peut faire : actualités et fonctionnalités de l'IA de Google

En ce qui concerne la Caractéristiques de Gemini 1.5 FlashGoogle a déclaré qu'il s'agissait du modèle le plus rapide disponible sur le marché. Apis (Interface de programmation d'applications), ou l’ensemble des « règles » qui permettent à différentes applications de communiquer entre elles. Selon Google, « il est optimisé pour les activités à grande échelle, à volume élevé et à haute fréquence ».

Gemini 1.5 Flash est également livré avec raisonnement multimodal, cela fonctionne donc via une entrée textuelle, vocale et visuelle. Un autre aspect intéressant est qu'il possède une fonctionnalité innovante fenêtre contextuelle pouvant contenir jusqu'à 1 million de jetons, équivalent à 10 à 11 heures de vidéo ou à des dizaines de milliers de lignes de code. Une quantité impressionnante de données et d’informations !

Toutes ces fonctionnalités permettent à Gemini 1.5 Flash d'exceller dans diverses tâches. Dans le communiqué officiel de Google, on lit en effet :

Gemini 1.5 Flash excelle dans la synthèse, les applications de chat, le sous-titrage d'images et de vidéos, l'extraction de données à partir de longs documents et tableaux, et bien plus encore.

Il faut dire que l'outil est conçu pour les développeurs qui entendent baser leurs produits et services sur l'IA de Google, et non pour les utilisateurs « finaux ».

Flash Gémeaux | Géopop — Crédits : Google.

Comment fonctionne le nouveau Google Gemini Flash : entraînement par distillation

Le « secret » derrière l'excellent rapport légèreté-puissance du Gemini Flash est le résultat du type de entraînement avec lequel le modèle a été formé. Google a en effet opté pour ce qu'on appelle formation à la « distillation ». Comment ça marche? Pour faire simple, ce processus consiste à transférer les connaissances et compétences essentielles d'un modèle plus grand (en l'occurrence, Gemini 1.5 Pro) vers un modèle plus petit et plus performant (en l'occurrence, Gemini 1.5 Flash).

D'un point de vue conceptuel, c'est comme si le modèle le plus grand agissait comme un « enseignant » pour le modèle plus petit qui, par conséquent, agirait comme un « élève ». Le modèle entraîné et « distillé » sera en effet capable de faire les mêmes choses que le modèle plus grand, mais à moindre coût et avec une latence réduite.

Quelles sont les autres nouveautés en matière d'IA annoncées lors de Google I/O

En plus du lancement de Gemini 1.5 Flash, Google a également annoncé quelques nouvelles concernant les autres modèles qui font partie de son « package ». En particulier, Gémeaux 1.5 Pro il a amélioré ses compétences en codage ainsi qu'en analyse de pistes audio et d'images. Google prévoit d'améliorer encore le modèle en doublant la fenêtre contextuelle de Gemini 1.5 Pro (et, par extension, également de 1.5 Flash) pour 2 millions de jetons. Cette dernière innovation ne sera accessible qu'en s'inscrivant sur une liste d'attente spécifique. Il a également été annoncé ledisponibilité immédiate de Gemini 1.5 Pro en 35 langues, dont l'italien, dans 150 pays pour les abonnés Gemini Advanced (21 €/mois après 2 mois d'essai gratuit).

En conclusion nous résumons les autres nouveautés annoncées lors de la conférence Google I/O.

Recherche Google basée sur l'IA : Grâce à l'outil AI Overviews, la recherche Google devient plus efficace, car les informations et les réponses à vos questions sont résumées et regroupées intelligemment.
VEO et Image 3 : sont deux outils d'IA générative qui permettent respectivement de générer des images et des vidéos ultra-réalistes (d'une durée de plus d'une minute) à partir d'une saisie textuelle.
Projet Astra : c'est un assistant numérique capable de traiter du texte, de la voix et des images en temps réel, capable de comprendre le contexte, un peu à la manière du GPT-4o.

Si vous souhaitez en savoir plus sur l'actualité dont nous vous avons parlé, vous pouvez visionner l'enregistrement de la conférence (en anglais) via la vidéo suivante.