Claude17 février 20265 min read

Claude Sonnet 4.6 d'Anthropic : contexte de 1M de tokens, pensée adaptative et un nouveau standard pour l'IA

Anthropic vient de publier Claude Sonnet 4.6, et c'est un bond significatif. Le modèle est livré avec une fenêtre de contexte de 1 million de tokens, un nouveau moteur de pensée adaptative, et des résultats de benchmarks qui le placent devant tous les modèles accessibles au public.

Fenêtre de contexte de 1M de tokens

La fonctionnalité phare est la longueur de contexte. Claude Sonnet 4.6 peut traiter jusqu'à 1 million de tokens en une seule requête. Cela représente environ 750 000 mots, soit l'équivalent d'environ 10 romans complets. Pour les développeurs, cela signifie qu'il est possible d'injecter des bases de code entières, des ensembles de documentation ou de longs historiques de conversation dans un seul prompt sans découpage ni résumé.

En pratique, cela change la façon dont on architecte les applications alimentées par l'IA. Les pipelines de génération augmentée par la récupération (RAG) qui nécessitaient auparavant des stratégies de découpage soigneuses peuvent désormais transmettre des blocs de contexte beaucoup plus importants directement. Pour l'analyse de code, il est possible d'inclure des centaines de fichiers dans une seule requête et de demander au modèle de raisonner sur l'ensemble.

Moteur de pensée adaptative

La deuxième fonctionnalité majeure est la pensée adaptative, un système qui alloue dynamiquement la puissance de calcul en fonction de la complexité de chaque partie d'un prompt. Les questions simples obtiennent des réponses rapides et efficaces. Les tâches de raisonnement complexes déclenchent automatiquement une analyse plus approfondie, sans que l'utilisateur ait besoin de spécifier un "mode de réflexion" ou d'ajuster des paramètres.

C'est différent des fonctionnalités de réflexion étendue des modèles Claude précédents, qui nécessitaient une activation explicite. La pensée adaptative est toujours active et prend ses propres décisions sur la quantité de calcul à consacrer à chaque réponse. Le résultat est des réponses plus rapides pour les tâches simples et une analyse plus approfondie pour les problèmes complexes, le tout au sein du même appel API.

Benchmarks

Les chiffres sont impressionnants. Claude Sonnet 4.6 obtient 72,5 % sur OSWorld, un benchmark d'utilisation informatique en conditions réelles qui teste la capacité d'une IA à accomplir des tâches sur différents systèmes d'exploitation. Il montre également de solides résultats sur SWE-bench, MMLU et HumanEval, bien qu'Anthropic ait été caractéristiquement mesuré dans la présentation de ces chiffres.

Ce qui compte plus que n'importe quel benchmark individuel, c'est la régularité. Sonnet 4.6 performe bien en programmation, analyse, rédaction et tâches multimodales sans les compromis qui accompagnent généralement l'optimisation pour une seule catégorie.

Tarification

Claude Sonnet 4.6 est facturé 3 $ par million de tokens en entrée et 15 $ par million de tokens en sortie. C'est compétitif par rapport aux autres modèles de pointe et représente une amélioration significative du rapport capacité-prix par rapport à la génération Sonnet précédente. La fenêtre de contexte de 1M est disponible au même tarif par token, sans supplément pour les contextes plus longs.

Ce que cela signifie pour les développeurs

Pour les équipes construisant des produits alimentés par l'IA, la fenêtre de contexte élargie réduit le besoin de stratégies complexes de découpage et de récupération. Les applications qui traitent de longs documents, de grandes bases de code ou des historiques de conversation étendus peuvent désormais transmettre significativement plus d'informations dans une seule requête. Le moteur de pensée adaptative supprime le besoin de basculer manuellement les modes de raisonnement, simplifiant l'intégration.

La combinaison de la longueur de contexte, du calcul adaptatif et de performances solides dans plusieurs domaines fait de Claude Sonnet 4.6 une base polyvalente pour un large éventail d'applications, de l'analyse de code et du traitement de documents aux outils créatifs et aux flux de travail multimodaux.

Genera

Claude Sonnet 4.6 d'Anthropic : contexte de 1M de tokens, pensée adaptative et un nouveau standard pour l'IA

Fenêtre de contexte de 1M de tokens

Moteur de pensée adaptative

Benchmarks

Tarification

Ce que cela signifie pour les développeurs

Related Articles

Previews pour Claude Code : retour visuel en direct, revue de code et CI en arrière-plan dans un seul outil de bureau

Claude Code automatise désormais les revues de sécurité avec une seule commande

L'IA texte vers vidéo : comment la technologie fonctionne vraiment