Anthropic lance Claude 3.5 Sonnet, l’IA qui défie le GPT-4o d’OpenAI : ce que l’on sait jusqu’à présent

Alexis Tremblay
Alexis Tremblay

Crédit : Anthropique

ChatGPT d’OpenAI a désormais un nouveau rival. Au cours des dernières heures Anthropiquela société d’intelligence artificielle fondée en 2021 par sept anciens salariés d’OpenAI, a en effet annoncé Claude 3.5 Sonnetson nouveau grand modèle de langage ou LLM (Grand modèle de langage). Selon ce qu’a déclaré la startup de San Francisco, lors de certains tests internes, le nouveau modèle a surpassé les résultats obtenus par les modèles d’entreprises concurrentes – notamment le GPT-4o d’OpenAI, le Gemini 1.5 Pro de Google et le Llama 3 400B de Meta – ainsi que les résultats obtenu par son modèle haut de gamme, soit Claude 3 Opus.

Claude 3.5 Sonnet est déjà disponible pour les utilisateurs de Claude.ai sur le web et sur l’application Claude pour iOS/iPadOS. La société a également annoncé que le modèle est également disponible viaAPI anthropique, Socle amazonien Et Vertex AI par Google Cloud. Le modèle est cher 3 $ par million de jetons d’entrée Et 15 $ par million de jetons de sortieavec un fenêtre contextuelle de 200 000 jetons.

Comment fonctionne Claude 3.5 Sonnet et ce qu’il peut faire : les tests réussis

Les tests réussis par Claude 3.5 Sonnet ont mis en évidence plusieurs aspects positifs, du moins selon ce qu’a déclaré Anthropic. Selon l’entreprise, Claude 3.5 Sonnet montre une amélioration significative dans la capture des nuances, de l’humour et même des instructions complexes, et est assez agile dans rédaction de contenu de haute qualité en utilisant un ton qu’Anthropic a qualifié de « naturel et pertinent ». Puisque Claude 3.5 Sonnet agit comme un doubler la vitesse de Claude 3 Opusil est parfait pour une utilisation dans des activités complexes, telles queservice client.

En testant son nouveau modèle, Anthropic a déclaré avoir soumis le modèle à un test indiquant qu’il corrigerait un bug ou ajouterait des fonctionnalités à une base de code open source. Claude 3.5 Sonnet a réussi à résoudre 64% des problèmescontre la 38% de réussite obtenu par Claude 3 Opus.

La société a également déclaré que le modèle est capable d’interpréter les informations présentes dans les images avec assez de précision, rapportant ce qui suit :

Le Claude 3.5 Sonnet est notre modèle de vision le plus puissant à ce jour, surpassant le Claude 3 Opus sur les critères de vision standard. Ces améliorations révolutionnaires sont particulièrement visibles pour les tâches qui nécessitent un raisonnement visuel, telles que l’interprétation de tableaux et de graphiques. Claude 3.5 Sonnet peut également transcrire avec précision du texte à partir d’images imparfaites, une fonctionnalité clé pour les services de vente au détail, de logistique et financiers, où l’IA peut glaner plus d’informations à partir d’une image, d’un graphique ou d’une illustration qu’à partir du texte uniquement.

Parallèlement à l’annonce de Claude 3.5 Sonnet, Anthropic a également présenté Artefacts (disponible sur Claude.ai), qui est une nouvelle fonctionnalité qui élargit la façon dont les utilisateurs peuvent interagir avec le modèle. En pratique, lorsque vous interrogez ce dernier demandant par exemple de générer du contenu tel que des documents texte, des projets de sites web, des fragments de code, etc., les sorties s’affichent dans une fenêtre dédiée à côté du chat avec le modèle. De cette façon, l’utilisateur peut interagir avec un espace de travail dynamique. Selon Anthropic, « cette fonctionnalité en avant-première marque l’évolution de Claude d’une IA conversationnelle à un environnement de travail collaboratif ».

Quand il pourrait sortir : les prochains mouvements d’Antropic

Anthropic a également annoncé travailler déjà à compléter la famille de modèles Claude 3.5 – Claude 3.5 Haïku Et Claude 3.5 Opus – qui sera publié d’ici 2024. Au-delà de cela, la société « développe de nouvelles méthodes et fonctionnalités pour prendre en charge davantage de cas d’utilisation pour les entreprises, y compris des intégrations avec des applications d’entreprise ».