Claude Opus 4.6 + GPT-5.3 Codex: Il mio flusso di lavoro a doppio modello, l'efficienza è direttamente raddoppiata

2/13/2026
7 min read

Amici che siete rimasti svegli fino all'alba ad aspettare il rilascio del nuovo modello, state bene?

Anthropic e OpenAI hanno rilasciato i rispettivi modelli di punta nello stesso giorno. La bacheca degli amici è già stata inondata da vari confronti di benchmark.

Ma oggi non voglio parlare di benchmark.

Voglio parlare di: cosa puoi ottenere da questo aggiornamento?

Flusso di lavoro collaborativo a doppio modello🔥 Prima di tutto, un dettaglio che mi ha fatto venire i brividi

Nel blog ufficiale di OpenAI c'è una frase:

"GPT-5.3-Codex è il nostro primo modello che ha svolto un ruolo importante nella sua stessa creazione."

Cosa significa?

Il team di OpenAI, durante lo sviluppo di GPT-5.3, ha utilizzato una versione precedente di Codex per eseguire il debug del processo di addestramento, gestire la distribuzione e analizzare i risultati dei test.

Loro stessi hanno detto di essere "rimasti scioccati dalla misura in cui Codex può accelerare il proprio sviluppo".

L'IA ha iniziato a partecipare al proprio sviluppo.

Questo mi ricorda l'articolo sul Moutai che ho scritto prima. All'epoca dissi: "Non importa se morirà in futuro, se può essere usato ora, usiamolo prima."

Ora voglio dire: la velocità dell'evoluzione dell'IA potrebbe essere più veloce di quanto immaginiamo.

Quando avrai "capito" e agirai, potrebbe essere troppo tardi.

💜 Claude Opus 4.6: non è più intelligente, è davvero in grado di aiutarti a lavorare

L'aggiornamento di Anthropic questa volta ha un titolo interessante nel blog ufficiale: "Advancing finance with Claude Opus 4.6".

Hanno ottimizzato appositamente per il settore finanziario. Ma non affrettarti ad andare via, queste capacità sono utili anche per noi.

🔧 Cowork: finalmente in grado di operare direttamente sui file locali

Questa è la funzionalità che aspetto con più impazienza.

Prima, con Claude, dovevi copiare e incollare il contenuto del file.

Ora, con Cowork, puoi consentire a Claude di accedere direttamente a una cartella sul tuo computer, può leggere, modificare e persino creare nuovi file.

Immagina: gli dai la cartella delle bozze di progettazione e gli chiedi di aiutarti a organizzare le specifiche di denominazione, generare documenti di progettazione e persino elaborare immagini in batch.

Questo non è il futuro, è una funzionalità che può essere utilizzata ora.

Funzionalità Cowork

📊 Claude in Excel e PowerPoint

Anthropic ha inserito Claude direttamente nella barra laterale di Excel e PowerPoint.

Il CTO di Hebbia ha detto: "Prima ci volevano ore per fare una presentazione finanziaria in PPT, ora ci vogliono pochi minuti."

Questa è una manna dal cielo per noi che facciamo presentazioni di prodotti e proposte di design.

Il co-fondatore di Shortcut AI ha detto: "Il salto di prestazioni di Opus 4.6 è quasi incredibile. Compiti che prima Opus 4.5 trovava difficili, ora sono improvvisamente diventati facili."

📈 Benchmark nel settore finanziario

Dati ufficiali:

Valutazione dell'agente finanziario: 60,7% (un aumento del 5,47% rispetto a Opus 4.5)

TaxEval: 76,0%

Valutazione della finanza nel mondo reale: un aumento di 23 punti percentuali rispetto a Sonnet 4.5

Cosa significano questi numeri? Claude è diventato davvero più forte nell'elaborazione di attività complesse che richiedono un ragionamento a più fasi.

💚 GPT-5.3 Codex: il modo di interazione è cambiato, questo è il punto chiave

⚡ Aumento della velocità del 25%, ma ancora più importante è che il modo di interazione è cambiato

Prima, con Codex, dovevi aspettare che finisse di funzionare per vedere i risultati. Volevi cambiare direzione? Fermalo e ricomincia.

Ora è diverso.

GPT-5.3 Codex riporterà i progressi durante il lavoro e puoi intervenire, porre domande e modificare la direzione in qualsiasi momento, senza perdere il contesto.

Questo modo di interazione è più simile alla collaborazione con un vero collega.

Confronto dei modi di interazione

🌐 Miglioramento delle capacità di sviluppo di siti web

L'ufficiale ha mostrato un esempio: ha chiesto a GPT-5.3 Codex e GPT-5.2 Codex di creare rispettivamente una landing page SaaS.

La versione di GPT-5.3:

✅ Converte automaticamente il prezzo annuale in un prezzo medio mensile, rendendo lo sconto più intuitivo

✅ Ha creato un componente di valutazione dell'utente a rotazione automatica, con tre diverse valutazioni

✅ Nel complesso, è più simile a un prodotto che può essere lanciato direttamente

La versione di GPT-5.2 è relativamente semplice e richiede più regolazioni manuali.

Questo miglioramento della capacità di "comprendere l'intento dell'utente" è molto utile per noi che creiamo prototipi e demo.

🔐 Sicurezza informatica: il primo modello contrassegnato come "ad alta capacità"

Molte persone non hanno notato queste informazioni.

GPT-5.3 Codex è il primo modello di OpenAI classificato come "High capability" nelle attività di sicurezza informatica.

Hanno lanciato appositamente il programma Trusted Access for Cyber e hanno promesso di investire 10 milioni di dollari in crediti API per supportare la ricerca sulla difesa della sicurezza informatica.

I confini delle capacità dell'IA si stanno espandendo rapidamente.

📊 Confronto dei benchmark: ognuno ha i suoi punti di forza

Terminal-Bench 2.0 (capacità di programmazione del terminale)

GPT-5.3 Codex: 77,3% GPT-5.2 Codex: 64,0% 📈 Aumento: 13,3 punti percentuali

OSWorld-Verified (capacità di operare su un computer)

GPT-5.3 Codex: 64,7% GPT-5.2 Codex: 38,2% 📈 Aumento: 26,5 punti percentuali

Nel complesso, GPT-5.3 Codex ha un enorme miglioramento nelle operazioni del terminale e nelle capacità di utilizzo del computer.

Confronto dei benchmark

🍺 Logica Moutai: cosa puoi ottenere prima che "muoiano"?

Qualche tempo fa ho scritto un articolo, usando la logica di Duan Yongping di acquistare Moutai per spiegare il valore degli strumenti di IA.

Il punto di vista principale è:

Copilot sarà sostituito? Forse.

Cursor ha un fossato? In effetti non è profondo.

Claude Code è la forma definitiva? Sicuramente no.

Ma tutto questo non è importante.

L'importante è: quanti dividendi puoi ottenere da loro prima che "muoiano"?

Ora Claude Opus 4.6 e GPT-5.3 Codex sono arrivati, la stessa domanda:

Questi due modelli saranno sostituiti? Sicuramente lo saranno.

Sono la forma definitiva dell'IA? Ovviamente no.

Ma prima che vengano sostituiti?

Alcune persone useranno Cowork per aumentare l'efficienza dei documenti di progettazione di 10 volte.

Alcune persone useranno Claude in Excel per ridurre il tempo di analisi dei dati da un giorno a un'ora.

Alcune persone useranno la collaborazione interattiva di GPT-5.3 Codex per creare un SaaS completo in una settimana.

E tu? Stai ancora aspettando che esca uno "strumento migliore"?

🎯 I miei consigli di scelta

Fare proposte di design, presentazioni di prodotti, analisi dei dati → Claude Opus 4.6

👉 Integrazione Cowork + Excel/PowerPoint, più adatto per scenari d'ufficio

Fare sviluppo di prototipi, scrivere codice, debug → GPT-5.3 Codex

👉 Forte capacità del terminale, buona esperienza interattiva, veloce

Usarli entrambi → Questa è la mia scelta

👉 Claude fa la ricerca preliminare e la documentazione, GPT fa lo sviluppo e il debug successivi

C'è anche una considerazione pratica: GPT è più stabile da usare in Cina.

Consigli di scelta

💰 Prezzo

Claude Opus 4.6

Input: $5 / milione di token Output: $25 / milione di token Più di 200.000 token di contesto: $10 / $37,50

GPT-5.3 Codex

Il prezzo dell'API non è stato ancora annunciato Attualmente utilizzato tramite l'abbonamento ChatGPT Plus/Pro

✨ Scritto alla fine

Ciò che mi ha colpito di più di questo aggiornamento non è stato di quanto sono migliorati i benchmark, ma il modo in cui l'IA funziona sta cambiando.

Claude inizia a operare direttamente sul tuo file system.

GPT inizia a parlare con te mentre lavora.

L'IA inizia a partecipare al proprio sviluppo.

Un anno fa, stavamo ancora discutendo se l'IA potesse scrivere codice.

Ora, stiamo discutendo se l'IA possa completare un progetto in modo indipendente.

E tra un anno?

Non conosco la risposta.

Ma so una cosa: le persone che hanno guadagnato denaro con gli strumenti di IA non ignorano che questi strumenti saranno sostituiti.

Hanno solo capito: non importa se morirà in futuro, se può essere usato ora, usiamolo prima.Aspetta che tu "abbia le idee chiare", e i bonus saranno già stati divisi.

Published in Technology

You Might Also Like