Claude Opus 4.6 + GPT-5.3 Codex：Mitt arbeidsfly med to modeller, effektiviteten dobles direkte

Er dere som har vært våkne til langt på natt for å vente på lanseringen av de nye modellene, ok?

Anthropic og OpenAI lanserte sine respektive flaggskipmodeller samme dag. Venners sirkel har allerede blitt oversvømmet av ulike benchmark-sammenligninger.

Men i dag vil jeg ikke snakke om benchmarks.

Jeg vil snakke om: Hva kan du få ut av denne oppdateringen?

Arbeidsfly for samarbeid med to modeller 🔥 La meg først nevne en detalj som ga meg frysninger

Det er en setning i den offisielle OpenAI-bloggen:

«GPT-5.3-Codex er vår første modell som spiller en viktig rolle i sin egen skapelse.»

Hva betyr det?

Under utviklingen av GPT-5.3 brukte OpenAI-teamet en tidlig versjon av Codex til å feilsøke treningsprosessen, administrere distribusjonen og analysere testresultatene.

De sa selv at de var «sjokkerte over hvor mye Codex kunne akselerere deres egen utvikling».

AI har begynt å delta i sin egen utvikling.

Dette minner meg om artikkelen om Moutai jeg skrev tidligere. Den gang sa jeg: «Uansett om den vil dø i fremtiden, la oss bruke den nå mens vi kan.»

Nå vil jeg si: Hastigheten på AI-utviklingen kan være raskere enn vi forestiller oss.

Når du har «tenkt deg om» og handler, kan det allerede være for sent.

💜 Claude Opus 4.6: Ikke bare smartere, men faktisk i stand til å hjelpe deg med å få ting gjort

Anthropic sin oppdatering denne gangen har en veldig interessant tittel på den offisielle bloggen: «Advancing finance with Claude Opus 4.6».

De har spesielt optimalisert for finansbransjen. Men ikke skynd deg å gå videre, disse evnene er også nyttige for oss.

🔧 Cowork: Endelig i stand til å operere lokale filer direkte

Dette er funksjonen jeg har ventet mest på.

Tidligere, når du brukte Claude, måtte du kopiere og lime inn filinnholdet.

Nå, med Cowork, kan du la Claude få direkte tilgang til en mappe på datamaskinen din, den kan lese, redigere og til og med opprette nye filer.

Tenk deg: Du gir den mappen med designutkast, og lar den hjelpe deg med å organisere navnekonvensjoner, generere designdokumenter og til og med batchbehandle bilder.

Dette er ikke fremtiden, det er en funksjon som kan brukes nå.

Cowork-funksjon

📊 Claude i Excel og PowerPoint

Anthropic har satt Claude direkte inn i sidepanelet i Excel og PowerPoint.

CTO i Hebbia sa: «Før tok det flere timer å lage en finansiell PPT, nå tar det bare noen få minutter.»

Dette er rett og slett en velsignelse for oss som lager produktrapporter og designforslag.

Medgründeren av Shortcut AI sa: «Ytelseshoppet til Opus 4.6 er nesten utrolig. Oppgaver som Opus 4.5 tidligere fant vanskelige, har nå plutselig blitt enkle.»

📈 Benchmarks i finanssektoren

Offisielle data:

Finance Agent-evaluering: 60,7 % (5,47 % høyere enn Opus 4.5)

TaxEval: 76,0 %

Real-World Finance-evaluering: 23 prosentpoeng høyere enn Sonnet 4.5

Hva betyr disse tallene? Claude har virkelig blitt sterkere i å håndtere komplekse oppgaver som krever resonnement i flere trinn.

💚 GPT-5.3 Codex: Interaksjonsmåten har endret seg, det er det viktigste

⚡ 25 % raskere, men viktigere er at interaksjonsmåten har endret seg

Tidligere, når du brukte Codex, måtte du vente til den var ferdig før du kunne se resultatene. Vil du endre retning? Stopp og start på nytt.

Nå er det annerledes.

GPT-5.3 Codex vil rapportere fremdriften mens den jobber, og du kan når som helst avbryte, stille spørsmål og justere retningen uten å miste konteksten.

Denne interaksjonsmåten er mer som å samarbeide med en ekte kollega.

Sammenligning av interaksjonsmåter

🌐 Forbedring av nettstedsutviklingsevner

Den offisielle demonstrasjonen viser et eksempel: La GPT-5.3 Codex og GPT-5.2 Codex lage en SaaS-landingsside hver.

GPT-5.3-versjonen:

✅ Konverterer automatisk den årlige prisen til en gjennomsnittlig månedlig pris, noe som gjør rabatten mer intuitiv

✅ Laget en automatisk roterende brukeranmeldelseskomponent med tre forskjellige anmeldelser

✅ Totalt sett mer som et produkt som kan lanseres direkte

GPT-5.2-versjonen er relativt enkel og krever mer manuell justering.

Denne forbedringen i evnen til å «forstå brukerintensjoner» er veldig nyttig for oss som lager prototyper og demoer.

🔐 Nettverkssikkerhet: Den første modellen som er merket som «høy kapasitet»

Mange har ikke lagt merke til denne informasjonen.

GPT-5.3 Codex er den første OpenAI-modellen som er klassifisert som «høy kapasitet» i nettverkssikkerhetsoppgaver.

De har spesielt lansert Trusted Access for Cyber-programmet og lovet å investere 10 millioner dollar i API-kreditter for å støtte forskning på nettverkssikkerhetsforsvar.

AI sine kapasitetsgrenser utvides raskt.

📊 Benchmark-sammenligning: Hver har sine styrker

Terminal-Bench 2.0 (terminalprogrammeringsevne)

GPT-5.3 Codex: 77,3 % GPT-5.2 Codex: 64,0 % 📈 Forbedring: 13,3 prosentpoeng

OSWorld-Verified (evne til å operere datamaskinen)

GPT-5.3 Codex: 64,7 % GPT-5.2 Codex: 38,2 % 📈 Forbedring: 26,5 prosentpoeng

Totalt sett har GPT-5.3 Codex gjort store forbedringer i terminaloperasjoner og datamaskinbruk.

Benchmark-sammenligning

🍺 Moutai-logikk: Hva kan du få før de «dør»?

For en tid tilbake skrev jeg en artikkel der jeg brukte Duan Yongpings logikk om å kjøpe Moutai for å forklare verdien av AI-verktøy.

Hovedsynspunktet er:

Vil Copilot bli erstattet? Kanskje.

Har Cursor en vollgrav? Egentlig ikke så dyp.

Er Claude Code den ultimate formen? Definitivt ikke.

Men alt dette er ikke viktig.

Det som er viktig er: Hvor mye utbytte kan du få ut av dem før de «dør»?

Nå er Claude Opus 4.6 og GPT-5.3 Codex her, det samme spørsmålet:

Vil disse to modellene bli erstattet? Definitivt.

Er de den ultimate formen for AI? Selvfølgelig ikke.

Men hva med før de blir erstattet?

Noen vil bruke Cowork til å øke effektiviteten av designdokumenter med 10 ganger.

Noen vil bruke Claude i Excel til å redusere dataanalysetiden fra en dag til en time.

Noen vil bruke GPT-5.3 Codex sin interaktive samarbeidsfunksjon til å lage en komplett SaaS på en uke.

Og hva med deg? Venter du fortsatt på at «bedre verktøy» skal komme ut?

🎯 Mine anbefalinger

Lage designforslag, produktrapporter, dataanalyse → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint-integrasjon, mer vennlig for kontorarbeid

Lage prototypeutvikling, skrive kode, feilsøke → GPT-5.3 Codex

👉 Sterk terminalkapasitet, god interaksjonsopplevelse, rask

Bruk begge → Dette er mitt valg

👉 Claude for innledende undersøkelser og dokumentasjon, GPT for senere utvikling og feilsøking

Det er også en praktisk vurdering: GPT er mer stabil å bruke i Kina.

Anbefalinger

💰 Pris

Claude Opus 4.6

Inndata: $5 / million tokens Utdata: $25 / million tokens Over 200 000 token kontekst: $10 / $37,50

GPT-5.3 Codex

API-prisen er ikke offentliggjort ennå. For øyeblikket tilgjengelig via ChatGPT Plus/Pro-abonnement

✨ Avsluttende ord

Det som imponerte meg mest med denne oppdateringen er ikke hvor mye benchmarkene har forbedret seg, men hvordan AI sin arbeidsmåte endrer seg.

Claude begynner å operere filsystemet ditt direkte.

GPT begynner å snakke med deg mens den jobber.

AI begynner å delta i sin egen utvikling.

For et år siden diskuterte vi fortsatt om AI kunne skrive kode.

Nå diskuterer vi om AI kan fullføre et prosjekt uavhengig.

Hva med om et år?

Jeg vet ikke svaret.

Men jeg vet en ting: De som tjener penger med AI-verktøy, de vet ikke at disse verktøyene vil bli erstattet.

De har bare funnet ut: Uansett om den vil dø i fremtiden, la oss bruke den nå mens vi kan.Vent til du «har tenkt deg om», så er bonusen allerede delt ut.

Claude Opus 4.6 + GPT-5.3 Codex：Mitt arbeidsfly med to modeller, effektiviteten dobles direkte

💜 Claude Opus 4.6: Ikke bare smartere, men faktisk i stand til å hjelpe deg med å få ting gjort

🔧 Cowork: Endelig i stand til å operere lokale filer direkte

📊 Claude i Excel og PowerPoint

📈 Benchmarks i finanssektoren

💚 GPT-5.3 Codex: Interaksjonsmåten har endret seg, det er det viktigste

⚡ 25 % raskere, men viktigere er at interaksjonsmåten har endret seg

🌐 Forbedring av nettstedsutviklingsevner

🔐 Nettverkssikkerhet: Den første modellen som er merket som «høy kapasitet»

📊 Benchmark-sammenligning: Hver har sine styrker

🍺 Moutai-logikk: Hva kan du få før de «dør»?

🎯 Mine anbefalinger

💰 Pris

✨ Avsluttende ord

You Might Also Like

Claude Code Buddy Modifikasjonsguide: Hvordan få glitrende legendariske kjæledyr

Obsidian har lansert Defuddle, og hevet Obsidian Web Clipper til nye høyder

OpenAI plutselig kunngjør "tre-i-ett": sammenslåing av nettleser + programmering + ChatGPT, internt innrømmer de at de har gått feil vei det siste året

2026, ikke tving deg selv til "selvdisiplin"! Gjør disse 8 små tingene, så kommer helsen naturlig

Mødre som sliter med å gå ned i vekt, er absolutt fanget her

AI Browser 24-timers stabil drift guide