Claude Opus 4.6 + GPT-5.3 Codex : Mon flux de travail à double modèle, efficacité directement doublée

Les amis qui ont veillé tard dans la nuit pour attendre la sortie des nouveaux modèles, ça va ?

Anthropic et OpenAI ont publié leurs modèles phares respectifs le même jour. Les fils d'actualité sont déjà inondés de comparaisons de benchmarks.

Mais aujourd'hui, je ne veux pas parler de benchmarks.

Je veux parler de : que pouvez-vous tirer de cette mise à jour ?

Flux de travail collaboratif à double modèle 🔥 D'abord, un détail qui m'a donné froid dans le dos

Il y a une phrase dans le blog officiel d'OpenAI :

« GPT-5.3-Codex est notre premier modèle qui a joué un rôle important dans sa propre création. »

Qu'est-ce que ça veut dire ?

L'équipe d'OpenAI, lors du développement de GPT-5.3, a utilisé une version antérieure de Codex pour déboguer le processus d'entraînement, gérer le déploiement et analyser les résultats des tests.

Ils disent eux-mêmes avoir été « stupéfaits par la mesure dans laquelle Codex peut accélérer son propre développement ».

L'IA commence à participer à son propre développement.

Cela me rappelle l'article sur le Maotai que j'ai écrit précédemment. J'avais dit à l'époque : « Peu importe s'il va mourir plus tard, s'il est utilisable maintenant, utilisons-le d'abord. »

Maintenant, je veux dire : la vitesse d'évolution de l'IA est peut-être plus rapide que nous ne le pensons.

Si vous attendez d'avoir « bien réfléchi » avant d'agir, il sera peut-être trop tard.

💜 Claude Opus 4.6 : Ce n'est pas qu'il est plus intelligent, c'est qu'il peut vraiment vous aider à travailler

La mise à jour d'Anthropic cette fois-ci a un titre de blog officiel très intéressant : « Faire progresser la finance avec Claude Opus 4.6 ».

Ils ont spécialement optimisé pour le secteur financier. Mais ne vous précipitez pas, ces capacités sont également utiles pour nous.

🔧 Cowork : Enfin capable de manipuler directement les fichiers locaux

C'est la fonctionnalité que j'attendais le plus.

Auparavant, avec Claude, il fallait copier-coller le contenu du fichier.

Maintenant, avec Cowork, vous pouvez laisser Claude accéder directement à un dossier sur votre ordinateur, il peut lire, modifier et même créer de nouveaux fichiers.

Imaginez : vous lui donnez le dossier des maquettes de conception, et vous le laissez vous aider à organiser les conventions de nommage, à générer la documentation de conception, et même à traiter les images par lots.

Ce n'est pas le futur, c'est une fonctionnalité utilisable dès maintenant.

Fonctionnalité Cowork

📊 Claude dans Excel et PowerPoint

Anthropic a intégré Claude directement dans la barre latérale d'Excel et de PowerPoint.

Le CTO de Hebbia a déclaré : « Auparavant, il fallait plusieurs heures pour faire un PPT financier, maintenant c'est fait en quelques minutes. »

C'est une aubaine pour ceux d'entre nous qui font des présentations de produits et des propositions de conception.

Le cofondateur de Shortcut AI a déclaré : « Le bond de performance d'Opus 4.6 est presque incroyable. Les tâches qu'Opus 4.5 trouvait difficiles sont maintenant soudainement devenues faciles. »

📈 Benchmarks dans le domaine financier

Données officielles :

Évaluation de l'agent financier : 60,7 % (soit une amélioration de 5,47 % par rapport à Opus 4.5)

TaxEval : 76,0 %

Évaluation de la finance du monde réel : amélioration de 23 points de pourcentage par rapport à Sonnet 4.5

Que signifient ces chiffres ? Claude est effectivement devenu plus fort dans le traitement des tâches complexes qui nécessitent un raisonnement en plusieurs étapes.

💚 GPT-5.3 Codex : La façon dont il interagit a changé, c'est ça le plus important

⚡ Vitesse accrue de 25 %, mais plus important encore, la façon dont il interagit a changé

Auparavant, avec Codex, il fallait attendre qu'il ait fini de tourner pour voir les résultats. Vous voulez changer de direction ? Arrêtez et recommencez.

Maintenant, c'est différent.

GPT-5.3 Codex rend compte de ses progrès pendant qu'il travaille, vous pouvez intervenir à tout moment, poser des questions, ajuster la direction, sans perdre le contexte.

Cette façon d'interagir ressemble plus à une collaboration avec un vrai collègue.

Comparaison des modes d'interaction

🌐 Amélioration des capacités de développement de sites Web

L'équipe a présenté un exemple : laisser GPT-5.3 Codex et GPT-5.2 Codex faire chacun une page de destination SaaS.

La version de GPT-5.3 :

✅ Convertit automatiquement le prix annuel en prix mensuel moyen, rendant la réduction plus intuitive

✅ A créé un composant de commentaires d'utilisateurs à défilement automatique, avec trois commentaires différents

✅ Dans l'ensemble, ressemble plus à un produit qui peut être mis en ligne directement

La version de GPT-5.2 est relativement simple et nécessite plus d'ajustements manuels.

Cette amélioration de la capacité à « comprendre l'intention de l'utilisateur » est très utile pour ceux d'entre nous qui font des prototypes et des démos.

🔐 Cybersécurité : Premier modèle à être étiqueté comme « haute capacité »

Beaucoup de gens n'ont pas remarqué cette information.

GPT-5.3 Codex est le premier modèle d'OpenAI à être classé comme « haute capacité » dans les tâches de cybersécurité.

Ils ont spécialement lancé le programme Trusted Access for Cyber et ont promis d'investir 10 millions de dollars en crédits API pour soutenir la recherche sur la défense de la cybersécurité.

Les limites des capacités de l'IA s'étendent rapidement.

📊 Comparaison des benchmarks : Chacun a ses forces

Terminal-Bench 2.0 (capacité de programmation terminale)

GPT-5.3 Codex : 77,3 % GPT-5.2 Codex : 64,0 % 📈 Amélioration : 13,3 points de pourcentage

OSWorld-Verified (capacité d'utilisation de l'ordinateur)

GPT-5.3 Codex : 64,7 % GPT-5.2 Codex : 38,2 % 📈 Amélioration : 26,5 points de pourcentage

Dans l'ensemble, GPT-5.3 Codex a considérablement amélioré ses capacités d'opération terminale et d'utilisation de l'ordinateur.

Comparaison des benchmarks

🍺 Logique du Maotai : Que pouvez-vous obtenir avant qu'ils ne « meurent » ?

Récemment, j'ai écrit un article, utilisant la logique de Duan Yongping pour acheter du Maotai pour expliquer la valeur des outils d'IA.

Le point de vue central est :

Copilot sera-t-il remplacé ? Peut-être.

Cursor a-t-il un fossé ? Ce n'est pas très profond.

Claude Code est-il la forme ultime ? Certainement pas.

Mais tout cela n'a pas d'importance.

Ce qui compte, c'est : combien de dividendes pouvez-vous en tirer avant qu'ils ne « meurent » ?

Maintenant, Claude Opus 4.6 et GPT-5.3 Codex sont arrivés, même question :

Ces deux modèles seront-ils remplacés ? Certainement.

Sont-ils la forme ultime de l'IA ? Bien sûr que non.

Mais avant qu'ils ne soient remplacés ?

Certains utiliseront Cowork pour multiplier par 10 l'efficacité de la documentation de conception.

Certains utiliseront Claude dans Excel pour réduire le temps d'analyse des données d'une journée à une heure.

Certains utiliseront la collaboration interactive de GPT-5.3 Codex pour créer un SaaS complet en une semaine.

Et vous ? Attendez-vous toujours que « de meilleurs outils » sortent ?

🎯 Mes conseils de choix

Faire des propositions de conception, des présentations de produits, des analyses de données → Claude Opus 4.6

👉 Intégration Cowork + Excel/PowerPoint, plus convivial pour les scénarios de bureau

Faire du développement de prototypes, écrire du code, déboguer → GPT-5.3 Codex

👉 Forte capacité terminale, bonne expérience interactive, rapide

Utiliser les deux → C'est mon choix

👉 Claude pour la recherche et la documentation préliminaires, GPT pour le développement et le débogage ultérieurs

Il y a aussi une considération réaliste : GPT est plus stable à utiliser au Canada.

Conseils de choix

💰 Prix

Claude Opus 4.6

Entrée : 5 $ / million de tokens Sortie : 25 $ / million de tokens Plus de 200 000 tokens de contexte : 10 $ / 37,50 $

GPT-5.3 Codex

Prix de l'API non encore annoncé Actuellement disponible via l'abonnement ChatGPT Plus/Pro

✨ Écrit à la fin

Ce qui m'a le plus marqué dans cette mise à jour, ce n'est pas l'amélioration des benchmarks, mais la façon dont l'IA travaille qui change.

Claude commence à manipuler directement votre système de fichiers.

GPT commence à vous parler pendant qu'il travaille.

L'IA commence à participer à son propre développement.

Il y a un an, nous discutions encore de la capacité de l'IA à écrire du code.

Maintenant, nous discutons de la capacité de l'IA à réaliser un projet de manière indépendante.

Dans un an ?

Je ne connais pas la réponse.

Mais je sais une chose : ceux qui ont gagné de l'argent avec les outils d'IA ne sont pas ignorants du fait que ces outils seront remplacés.

Ils ont juste compris : peu importe s'il va mourir plus tard, s'il est utilisable maintenant, utilisons-le d'abord.Attends d'avoir « tout bien réfléchi », et les dividendes auront déjà été partagés.

Claude Opus 4.6 + GPT-5.3 Codex : Mon flux de travail à double modèle, efficacité directement doublée

💜 Claude Opus 4.6 : Ce n'est pas qu'il est plus intelligent, c'est qu'il peut vraiment vous aider à travailler

🔧 Cowork : Enfin capable de manipuler directement les fichiers locaux

📊 Claude dans Excel et PowerPoint

📈 Benchmarks dans le domaine financier

💚 GPT-5.3 Codex : La façon dont il interagit a changé, c'est ça le plus important

⚡ Vitesse accrue de 25 %, mais plus important encore, la façon dont il interagit a changé

🌐 Amélioration des capacités de développement de sites Web

🔐 Cybersécurité : Premier modèle à être étiqueté comme « haute capacité »

📊 Comparaison des benchmarks : Chacun a ses forces

🍺 Logique du Maotai : Que pouvez-vous obtenir avant qu'ils ne « meurent » ?

🎯 Mes conseils de choix

💰 Prix

✨ Écrit à la fin

You Might Also Like

Guide de modification de Claude Code Buddy : Comment obtenir un animal de compagnie légendaire brillant

Obsidian a lancé Defuddle, élevant Obsidian Web Clipper à un nouveau niveau

OpenAI annonce soudainement "trois en un" : fusion du navigateur + programmation + ChatGPT, admettant en interne avoir pris le mauvais chemin l'année dernière

2026, ne plus se forcer à être "discipliné" ! Faites ces 8 petites choses, la santé viendra naturellement

Ces mamans qui luttent pour perdre du poids mais n'y parviennent pas, tombent sûrement ici

Guide de fonctionnement stable de l'AI Browser 24 heures sur 24