comment ils travaillent et pourquoi ils approchent AGI

Alexis Tremblay
Alexis Tremblay

Actualités d’OpenAI : la société qui développe ChatGPT et Sora a officiellement annoncé le lancement prochain de deux nouveaux modèles d’IA très puissants, GPT-o3 Et GPT-o3-minirespectivement les successeurs des modèles o1 et o1-mini sortis plus tôt cette année. L’idée d’OpenAI est lancer o3-mini d’ici fin janvier et plus tard, rendre également disponible le modèle o3 Selon ce qui a été déclaré par la société gérée par. Sam Altmanle modèle o3, du moins dans certaines conditions, se rapproche du concept d’AGI (Intelligence générale artificielle) : avec cet acronyme, nous faisons référence à une sorte de « super intelligence artificielle » capable d’avoir des capacités de raisonnement très élevées, bien supérieures aux modèles d’IA « traditionnels ».

Les modèles ont été formés à l’aide duapprentissage par renforcement apprentissage par renforcementce qui permet à l’algorithme de « réfléchir » avant de fournir la réponse la plus précise. Pour le moment, ni o3 ni o3-mini ne sont encore disponibles à grande échelle, car ils sont réservés aux chercheurs en sécurité, qui peuvent s’inscrire pour avoir un aperçu de leur sécurité.

Ce que peuvent faire les nouveaux modèles AI o3 et o3-mini : caractéristiques et fonctionnalités

Par rapport au modèle précédent, o3 introduit un meilleure capacité de vérification des faitsun ajustement du temps de raisonnement et une nette amélioration des domaines d’utilisation relatifs à des domaines tels que mathématiquesle sciencele physique et le écrire du code. Cependant, cette puissance de calcul nécessite un coût élevé en ressources ce qui entraîne une certaine latence, rendant le modèle est plus adapté aux tâches complexes qu’aux utilisations générales.

ChatGPT o3 représente une évolution dans le paysage de l’intelligence artificielle pour son approche orientée raisonnement. Le modèle est en effet capable de « réfléchir » avant de répondredéveloppant une chaîne de pensée qui analyse un problème sous différentes perspectives. Ce processus améliore non seulement la fiabilité des résultats, mais permet également au modèle de aborder des problèmes complexes avec plus de précision par rapport aux modèles « traditionnels ». Qu’il suffise de dire, par exemple, qu’aucun modèle ne dépasse 2 % des problèmes mathématiques avec le Test Frontier Math d’EpochAItandis que o3 a réussi à atteindre le 25,2%.

Image

De plus, contrairement à ses prédécesseurs, o3 offre la possibilité de « réguler » le temps dédié au raisonnement : un temps plus long conduit à de meilleures performances, même si la latence augmente. Cette fonctionnalité donne à o3 plus de polyvalence et le distingue considérablement de GPT-o1, qui ne disposait pas de ce type de contrôle.

version o3-minien revanche, représente une variante plus compacte et spécifique pour des tâches ciblées. Bien que moins puissant que le o3, il est conçu pour fournir un équilibre entre efficacité et performancece qui le rend adapté à une utilisation dans des contextes où les ressources informatiques sont limitées. Cette distinction entre les deux modèles met en évidence la stratégie d’OpenAI visant à diversifier les applications de l’intelligence artificielle, en la rendant accessible à différents types d’utilisateurs et de scénarios opérationnels.

Un autre élément clé des nouveaux modèles o3 concerne le capacité à vérifier les faitsréduisant ainsi le risque de ce que l’on appelle les « hallucinations » de l’intelligence artificielle, c’est-à-dire des réponses apparemment cohérentes mais en réalité incorrectes. Cette vérification, qui n’élimine pas totalement le risque d’hallucinations (soyons clairs), a un coût : le modèle met plus de temps à apporter une réponse par rapport aux modèles n’intégrant pas de raisonnement. Malgré cela, les premiers tests montrent que o3 obtient des résultats extraordinaires dans les tests mathématiques et scientifiquessurpassant de loin son prédécesseur et établissant de nouvelles normes dans l’industrie.

Parce que les nouveaux modèles GPT nous rapprochent de l’AGI

L’objectif d’OpenAI est clairement de se rapprocher de plus en plus deAGIune technologie capable d’accomplir n’importe quelle tâche humaine avec un niveau d’autonomie et de compétence comparable ou supérieur au nôtre. Le modèle o3 a déjà obtenu des scores notables sur ARC-AGIun test conçu pour évaluer la capacité d’un système d’IA à acquérir efficacement de nouvelles compétences en dehors des données sur lesquelles il a été formé. Eh bien, o3 a un score de 87,5% dans le cadre de calcul élevé et dans le pire des cas, le modèle a triplé les performances de o1 (comme le souligne le graphique suivant). Vraiment pas mal !

Image

Cependant, comme l’a souligné François Choletcréateur du benchmark ARC-AGI, o3 peine sur des tâches simples pour les humains, suggérant que nous sommes encore relativement loin de l’AGI. Cholet, dans cette affaire, déclarait :

Les premières données suggèrent que le prochain benchmark représentera toujours un défi important pour o3, réduisant potentiellement son score à moins de 30 %, même avec un calcul élevé (alors qu’un humain intelligent serait toujours capable d’obtenir un score supérieur à 95 % sans formation) (… ) Nous saurons que l’AGI est une réalité lorsque la possibilité de créer des tâches faciles pour les humains normaux mais difficiles pour l’IA deviendra tout simplement impossible.

Qu’est-il arrivé à GPT-o2 ?

Nous concluons l’analyse approfondie par une question que les plus attentifs d’entre vous se seront déjà posée. Qu’est-il arrivé à GPT-o2 ? Pourquoi OpenAI a-t-il « ignoré » ce modèle en passant de GPT-o1 à GPT-o3 ? D’après ce qu’a déclaré Les informationsOpenAI a abandonné l’utilisation de l’acronyme « o2 » pour éviter d’éventuels problèmes juridiques avec le fournisseur de télécommunications britannique O2.