Ce que le nouveau modèle d’intelligence artificielle peut faire

Alexis Tremblay
Alexis Tremblay

Google a lancé le nouveau par surprise Grand modèle de langage (LLM) Gémeaux 1.0un modèle d’intelligence artificielle capable de travailler avec des textes, des images et des vidéos et destiné à faire office de « cerveau » pour Google Barde, le chatbot créé par le géant de Mountain View. Gemini a également été introduit, dans sa version la plus légère, dans Google Bard en anglais. 170 pays et commence déjà à faire des vagues car, selon Google, Les performances de Gemini dépasseraient celles de GPT-4 d’OpenAI, sur lequel il est basé ChatGPT. Il peut comprendre, exploiter et combiner différents types d’informations sans discontinuité.

Ce que Google Gemini peut faire

Une vidéo publiée par Google montre que Gemini est capable de reconnaître ce que nous dessinonsTu peux répéter s’il te plait matériel un objet est fabriqué, s’extirper entre différents langages, proposer un jeu en fonction de ce que nous lui montrons et reconnaître à quel jeu nous jouons, comparer des objets en fonction de leur apparence et de leur fonction, évaluer le meilleur choix basé sur une situation montrée, prédire ce qui va se passer dans une vidéo etc. Les résultats semblent effectivement vraiment remarquables.

Qu’est-ce que Gémeaux 1.0

Gémeaux 1.0 est le nom de la première génération du LLM Gemini développé par Google, ce dernier remplacera PaLM 2. Il fera office, comme mentionné, de LLM, donc Pas c’est confu avec le chatbot qui utilisera ce modèle (en l’occurrence Google Barde). Le chatbot, en effet, est le produit qui est développé et avec lequel l’utilisateur s’interface, tandis que le LLM représente le modèle linguistique, c’est-à-dire le « cerveau » de ce chatbot, qui définit ainsi les performance et la précision démontrée par le chatbot lui-même.

Les trois versions des Gémeaux

Gemini a été lancé en trois formats différents: Gémeaux Ultra, Gémeaux Pro Et Nain Gémeaux, les trois variantes de LLM ils diffèrent par capacité résolution des tâches assignées, compatibilité avec moi appareils mobiles et le temps nécessaire pour précision de la réponse.

Google Gemini ultra, pro et nano

Gémeaux Ultra

Gémeaux Ultra c’est le modèle le plus avancé parmi ceux présentés, c’est le plus grand et le plus complexe des trois modèles qui, selon les données exposées par Google, seraient capables de surpasser exposé par le modèle le plus avancé développé par OpenAI GPT4. Ce dernier modèle a été testé par Google également contre performances exprimées par des experts humains. Ces tests sont appelés MMLU (Compréhension massive du langage multitâche) et sont basés sur 57 sujets comme les mathématiques, la physique, l’histoire ou le droit : les résultats des tests ont montré à quel point Gemini Ultra a surpassé les résultats obtenus par les experts humains.

Gemini Ultra sera disponible à partir de 2024, bien que la date exacte de lancement n’ait pas encore été officialisée.

Gémeaux Pro

Gémeaux Pro il sera plutôt mis en œuvre par 13 décembre en version bêta dans Google Bardepuis je suis passé à d’autres produits dans les semaines suivantes Google comme, comment Recherche, Annonces, Chrome Et Duo IA. La mise à jour sera disponible pour développeurs Et entreprises.

Concernant les performances de Gémeaux Pro Dans le communiqué de presse officiel De Google tu peux lire:

Avant de le rendre public, nous avons testé Gémeaux Pro à travers une série de références standard de l’industrie. Dans six benchmarks sur huit, Gemini Pro a surperformé GPT-3.5 y compris MMLU (Massive Multitask Language Understanding), l’une des principales normes de mesure des grands modèles d’IA

Nain Gémeaux

Nain Gémeaux c’est le modèle plus petit des trois, censé être mis en œuvre dans appareils mobiles. Elle a notamment été officialisée par Google l’atterrissage de Nain Gémeaux sur le appareil haut de gamme récemment présenté par la société de vue sur la montagne c’est-à-dire le smartphone Pixels 8 Pro.

Nano atterrit sur le téléphones intelligents La marque Google confirme, une fois de plus, le volonté De Google pour le pousser aspects liés à l’Intelligence Artificielle sur les smartphones pour confirmer ce qui a déjà été entrepris à partir de 2021 avec le Système sur puce (SoC) Google Tensor sur smartphone Google-Pixels fortement concentré sur potentiel de l’intelligence artificielle.

Les innovations introduites et la comparaison avec GPT

Gémeaux permettra au chatbots de Google pour exprimer potentiel bien supérieur aux actuels. Grâce à Gémeaux Ultra, en fait, il pourra mieux comprendre le langage humain et, par conséquent, les demandes des utilisateurs pourront également reconnaître et analyser les formats l’audio, images Et vidéo.

La nature multimodal exprimé par les Gémeaux est l’élément caractérisant ce qui le différencie de la solution similaire de OpenAIgrâce à l’analyse de l’audio, images Et vidéo il sera possible de poser des questions complexes au chatbots De Google concernant ce qui est représenté dans le photo ou dans vidéo.

Google a ensuite voulu comparer les performances des modèles Gemini avec celles de GPT et a publié des résultats qui mettent en évidence comment le nouveau LLM exprime des capacités améliorées par rapport au LLM développé par OpenAI, nous rapportons une partie des résultats ci-dessous :

Comparaison des modèles Gemini

Comparaison des modèles Gemini

Source : Rapport Gemini.

Repères académiques

Références académiques Gemini

Comprendre les images

Comprendre les images Gémeaux

Comment puis-je essayer Gemini ?

Pour le moment, Google Gemini n’est distribué qu’en Version nano sur Google Bard en anglais pour Pixel 8 Pro. Les développeurs et les entreprises pourront essayer la version bêta Pro à partir de 13 décembre. Cela signifie que le LLM ne pourra travailler que sur des invites des textes. Pour pouvoir essayer la version la plus avancée, capable d’interagir avec des vidéos et des images, vous devrez attendre la sortie Version ultra Dans le 2024. En espérant que la version italienne ne soit pas trop longue à compléter par rapport à la version anglaise !