Claude Opus 4.6 + GPT-5.3 Codex : Mon flux de travail à double modèle, efficacité directement doublée

Amis qui veillez tard dans la nuit pour attendre la sortie des nouveaux modèles, ça va ?

Anthropic et OpenAI ont publié leurs modèles phares respectifs le même jour. Les朋友圈 (cercles d'amis) sont déjà inondés de comparaisons de benchmarks.

Mais aujourd'hui, je ne veux pas parler de benchmarks.

Je veux parler de : que pouvez-vous retirer de cette mise à jour ?

Flux de travail collaboratif à double modèle 🔥 D'abord, un détail qui me donne froid dans le dos

Il y a une phrase dans le blog officiel d'OpenAI :

« GPT-5.3-Codex est notre premier modèle qui a joué un rôle important dans sa propre création. »

Qu'est-ce que cela signifie ?

L'équipe d'OpenAI, lors du développement de GPT-5.3, a utilisé une version antérieure de Codex pour déboguer le processus d'entraînement, gérer le déploiement et analyser les résultats des tests.

Ils disent eux-mêmes qu'ils ont été « choqués par la mesure dans laquelle Codex peut accélérer son propre développement ».

L'IA commence à participer à son propre développement.

Cela me rappelle l'article sur Maotai que j'ai écrit précédemment. J'avais dit à l'époque : « Peu importe s'il mourra à l'avenir, s'il peut être utilisé maintenant, utilisons-le d'abord. »

Maintenant, je veux dire : la vitesse d'évolution de l'IA est peut-être plus rapide que nous ne le pensons.

Attendre d'avoir « bien réfléchi » avant d'agir, il est peut-être déjà trop tard.

💜 Claude Opus 4.6 : Pas plus intelligent, mais vraiment capable de vous aider à travailler

La mise à jour d'Anthropic cette fois-ci, le titre du blog officiel est très intéressant : « Faire progresser la finance avec Claude Opus 4.6 ».

Ils ont spécialement optimisé pour le secteur financier. Mais ne vous précipitez pas, ces capacités sont également utiles pour nous.

🔧 Cowork : Enfin capable de manipuler directement les fichiers locaux

C'est la fonctionnalité que j'attendais le plus.

Auparavant, avec Claude, vous deviez copier-coller le contenu du fichier.

Maintenant, avec Cowork, vous pouvez laisser Claude accéder directement à un dossier sur votre ordinateur, il peut lire, modifier et même créer de nouveaux fichiers.

Imaginez : vous lui donnez le dossier des maquettes de conception, et vous le laissez vous aider à organiser les règles de nommage, à générer des documents de conception, et même à traiter des images par lots.

Ce n'est pas le futur, c'est une fonctionnalité qui peut être utilisée dès maintenant.

Fonctionnalité Cowork

📊 Claude dans Excel et PowerPoint

Anthropic a directement intégré Claude dans la barre latérale d'Excel et de PowerPoint.

Le CTO de Hebbia a déclaré : « Auparavant, il fallait plusieurs heures pour faire un PPT financier, maintenant c'est fait en quelques minutes. »

C'est une aubaine pour ceux d'entre nous qui font des présentations de produits et des propositions de conception.

Le co-fondateur de Shortcut AI a déclaré : « Le saut de performance d'Opus 4.6 est presque incroyable. Les tâches qu'Opus 4.5 trouvait difficiles sont maintenant soudainement devenues faciles. »

📈 Benchmarks dans le domaine financier

Données officielles :

Évaluation de l'agent financier : 60,7 % (soit une augmentation de 5,47 % par rapport à Opus 4.5)

TaxEval : 76,0 %

Évaluation de la finance du monde réel : augmentation de 23 points de pourcentage par rapport à Sonnet 4.5

Que signifient ces chiffres ? Claude est effectivement devenu plus fort dans le traitement des tâches complexes qui nécessitent un raisonnement en plusieurs étapes.

💚 GPT-5.3 Codex : La façon d'interagir a changé, c'est ça le plus important

⚡ Augmentation de la vitesse de 25 %, mais plus important encore, la façon d'interagir a changé

Auparavant, avec Codex, vous deviez attendre qu'il ait fini de tourner pour voir les résultats. Vous voulez changer de direction ? Arrêtez et recommencez.

Maintenant, c'est différent.

GPT-5.3 Codex rendra compte de l'avancement du travail pendant qu'il travaille, vous pouvez intervenir à tout moment, poser des questions, ajuster la direction, sans perdre le contexte.

Cette façon d'interagir ressemble plus à une collaboration avec un vrai collègue.

Comparaison des modes d'interaction

🌐 Amélioration des capacités de développement de sites web

L'officiel a montré un exemple : laisser GPT-5.3 Codex et GPT-5.2 Codex faire respectivement une page de destination SaaS.

La version de GPT-5.3 :

✅ Convertit automatiquement le prix annuel en prix mensuel moyen, rendant la réduction plus intuitive

✅ A créé un composant de revue utilisateur à défilement automatique, avec trois avis différents

✅ Dans l'ensemble, ressemble plus à un produit qui peut être mis en ligne directement

La version de GPT-5.2 est relativement simple et nécessite plus d'ajustements manuels.

Cette amélioration de la capacité à « comprendre l'intention de l'utilisateur » est très utile pour ceux d'entre nous qui font des prototypes et des démos.

🔐 Cybersécurité : Premier modèle à être marqué comme « haute capacité »

Beaucoup de gens n'ont pas remarqué cette information.

GPT-5.3 Codex est le premier modèle d'OpenAI à être classé comme « High capability » dans les tâches de cybersécurité.

Ils ont spécialement lancé le programme Trusted Access for Cyber et ont également promis d'investir 10 millions de dollars en quota d'API pour soutenir la recherche sur la défense de la cybersécurité.

Les limites de capacité de l'IA s'étendent rapidement.

📊 Comparaison des benchmarks : Chacun a ses forces

Terminal-Bench 2.0 (capacité de programmation du terminal)

GPT-5.3 Codex : 77,3 % GPT-5.2 Codex : 64,0 % 📈 Augmentation : 13,3 points de pourcentage

OSWorld-Verified (capacité d'utilisation de l'ordinateur)

GPT-5.3 Codex : 64,7 % GPT-5.2 Codex : 38,2 % 📈 Augmentation : 26,5 points de pourcentage

Dans l'ensemble, GPT-5.3 Codex a considérablement amélioré les capacités d'exploitation du terminal et d'utilisation de l'ordinateur.

Comparaison des benchmarks

🍺 Logique Maotai : Que pouvez-vous retirer avant qu'ils ne « meurent » ?

Il y a quelque temps, j'ai écrit un article, utilisant la logique de Duan Yongping pour acheter Maotai pour expliquer la valeur des outils d'IA.

Le point de vue central est :

Copilot sera-t-il remplacé ? Peut-être.

Cursor a-t-il un fossé ? Ce n'est pas très profond.

Claude Code est-il la forme ultime ? Certainement pas.

Mais tout cela n'a pas d'importance.

Ce qui compte, c'est : combien de dividendes pouvez-vous en retirer avant qu'ils ne « meurent » ?

Maintenant, Claude Opus 4.6 et GPT-5.3 Codex sont arrivés, même question :

Ces deux modèles seront-ils remplacés ? Bien sûr que oui.

Sont-ils la forme ultime de l'IA ? Bien sûr que non.

Mais avant qu'ils ne soient remplacés ?

Certains utiliseront Cowork pour multiplier par 10 l'efficacité des documents de conception.

Certains utiliseront Claude dans Excel pour réduire le temps d'analyse des données d'une journée à une heure.

Certains utiliseront la collaboration interactive de GPT-5.3 Codex pour créer un SaaS complet en une semaine.

Et vous ? Attendez-vous toujours que « de meilleurs outils » sortent ?

🎯 Mes conseils de choix

Faire des propositions de conception, des présentations de produits, des analyses de données → Claude Opus 4.6

👉 Intégration Cowork + Excel/PowerPoint, plus convivial pour les scénarios de bureau

Faire du développement de prototypes, écrire du code, déboguer → GPT-5.3 Codex

👉 Forte capacité de terminal, bonne expérience interactive, rapide

Utiliser les deux → C'est mon choix

👉 Claude fait la recherche et la documentation préliminaires, GPT fait le développement et le débogage ultérieurs

Il y a aussi une considération réaliste : GPT est plus stable à utiliser en Chine.

Conseils de choix

💰 Prix

Claude Opus 4.6

Entrée : 5 $/million de tokens Sortie : 25 $/million de tokens Plus de 200 000 tokens de contexte : 10 $/37,50 $

GPT-5.3 Codex

Prix de l'API non encore annoncé Actuellement utilisé via l'abonnement ChatGPT Plus/Pro

✨ Écrit à la fin

Ce qui m'a le plus marqué dans cette mise à jour, ce n'est pas l'augmentation des benchmarks, mais la façon dont l'IA travaille qui change.

Claude commence à manipuler directement votre système de fichiers.

GPT commence à discuter avec vous pendant qu'il travaille.

L'IA commence à participer à son propre développement.

Il y a un an, nous discutions encore de la possibilité pour l'IA d'écrire du code.

Maintenant, nous discutons de la possibilité pour l'IA de réaliser un projet de manière indépendante.

Dans un an ?

Je ne connais pas la réponse.

Mais je sais une chose : ceux qui ont gagné de l'argent avec les outils d'IA ne sont pas ignorants du fait que ces outils seront remplacés.

Ils ont juste compris : peu importe s'il mourra à l'avenir, s'il peut être utilisé maintenant, utilisons-le d'abord.Attends d'avoir "réfléchi clairement", et les avantages auront déjà été partagés.

Claude Opus 4.6 + GPT-5.3 Codex : Mon flux de travail à double modèle, efficacité directement doublée

💜 Claude Opus 4.6 : Pas plus intelligent, mais vraiment capable de vous aider à travailler

🔧 Cowork : Enfin capable de manipuler directement les fichiers locaux

📊 Claude dans Excel et PowerPoint

📈 Benchmarks dans le domaine financier

💚 GPT-5.3 Codex : La façon d'interagir a changé, c'est ça le plus important

⚡ Augmentation de la vitesse de 25 %, mais plus important encore, la façon d'interagir a changé

🌐 Amélioration des capacités de développement de sites web

🔐 Cybersécurité : Premier modèle à être marqué comme « haute capacité »

📊 Comparaison des benchmarks : Chacun a ses forces

🍺 Logique Maotai : Que pouvez-vous retirer avant qu'ils ne « meurent » ?

🎯 Mes conseils de choix

💰 Prix

✨ Écrit à la fin

You Might Also Like

Guide de modification de Claude Code Buddy : Comment obtenir un animal de compagnie légendaire brillant

Obsidian a lancé Defuddle, élevant Obsidian Web Clipper à un nouveau niveau

OpenAI annonce soudainement "trois en un" : fusion du navigateur + programmation + ChatGPT, admettant en interne avoir pris le mauvais chemin l'année dernière

2026, ne vous forcez plus à être 'discipliné' ! Faites ces 8 petites choses, la santé viendra naturellement

Ces mamans qui luttent pour perdre du poids mais n'y arrivent pas, sont certainement piégées ici

Guide de fonctionnement stable de l'AI Browser 24 heures sur 24