Claude Opus 4.6 + GPT-5.3 Codex: Kaksoismallityönkulkuni, tehokkuus suoraan kaksinkertaistuu
Oletteko kunnossa, ystävät, jotka valvovat aamuyöhön odottaen uusien mallien julkaisua?
Anthropic ja OpenAI julkaisivat kumpikin lippulaivamallinsa samana päivänä. Ystäväpiiri on jo täynnä erilaisia suorituskykyvertailuja.
Mutta tänään en halua puhua suorituskyvystä.
Haluan puhua siitä: mitä voit saada tästä päivityksestä?
🔥 Ensin yksityiskohta, joka sai minut kylmäämään
OpenAI:n virallisessa blogissa on lause:
"GPT-5.3-Codex on ensimmäinen mallimme, jolla on ollut merkittävä rooli oman luomisensa prosessissa."
Mitä se tarkoittaa?
OpenAI:n tiimi käytti GPT-5.3:n kehittämisessä Codexin varhaisia versioita virheenkorjaukseen koulutusprosessissa, hallintaan, käyttöönottoon ja testitulosten analysointiin.
He itsekin sanovat olevansa "hämmästyneitä siitä, kuinka paljon Codex pystyi nopeuttamaan heidän omaa kehitystään".
AI on alkanut osallistua omaan kehitykseensä.
Se muistuttaa minua aiemmin kirjoittamastani Moutai-artikkelista. Silloin sanoin: "Vaikka se kuolisi myöhemmin, käytetään sitä nyt, kun se on mahdollista."
Nyt haluan sanoa: AI:n evoluution nopeus voi olla nopeampi kuin luulemme.
Kun olet "ajatellut asian selväksi" ennen kuin toimit, voi olla jo liian myöhäistä.
💜 Claude Opus 4.6: Ei älykkäämpi, vaan todella pystyy auttamaan sinua tekemään töitä
Anthropicin tämänpäiväisen päivityksen virallisen blogin otsikko on mielenkiintoinen: "Advancing finance with Claude Opus 4.6".
He ovat tehneet erityisiä optimointeja rahoitusalalle. Mutta älä hätäile, nämä ominaisuudet ovat hyödyllisiä myös meille.
🔧 Cowork: Vihdoinkin voi suoraan käsitellä paikallisia tiedostoja
Tämä on ominaisuus, jota odotin eniten.
Aiemmin Claudea käytettäessä tiedostojen sisältö piti kopioida ja liittää.
Nyt Coworkin avulla voit antaa Clauden käyttää suoraan tietokoneesi tiettyä kansiota, se voi lukea, muokata ja jopa luoda uusia tiedostoja.
Kuvittele: annat sille suunnitteluluonnosten kansion ja pyydät sitä auttamaan sinua järjestämään nimeämiskäytännöt, luomaan suunnitteluasiakirjoja ja jopa käsittelemään kuvia erissä.
Tämä ei ole tulevaisuutta, vaan ominaisuus, jota voi käyttää nyt.

📊 Claude Excelissä ja PowerPointissa
Anthropic on sijoittanut Clauden suoraan Excelin ja PowerPointin sivupalkkiin.
Hebbian teknologiajohtaja sanoi: "Aiemmin rahoitus-PPT:n tekemiseen meni tunteja, nyt se on valmis muutamassa minuutissa."
Tämä on suuri apu meille, jotka teemme tuote-esityksiä ja suunnitteluehdotuksia.
Shortcut AI:n toinen perustaja sanoi: "Opus 4.6:n suorituskyvyn harppaus on lähes uskomaton. Tehtävät, jotka Opus 4.5:n mielestä olivat vaikeita, ovat nyt yhtäkkiä helppoja."
📈 Suorituskykyvertailu rahoitusalalla
Viralliset tiedot:
Finance Agent -arviointi: 60,7 % (5,47 % enemmän kuin Opus 4.5)
TaxEval: 76,0 %
Real-World Finance -arviointi: 23 prosenttiyksikköä enemmän kuin Sonnet 4.5
Mitä nämä luvut osoittavat? Claude on todella vahvistunut monimutkaisten, monivaiheista päättelyä vaativien tehtävien käsittelyssä.
💚 GPT-5.3 Codex: Vuorovaikutustapa on muuttunut, se on pääasia
⚡ Nopeus kasvaa 25 %, mutta tärkeämpää on, että vuorovaikutustapa on muuttunut
Aiemmin Codexiä käytettäessä piti odottaa, että se suoritti tehtävänsä, ennen kuin näki tulokset. Haluatko muuttaa suuntaa? Pysäytä ja aloita alusta.
Nyt se on toisin.
GPT-5.3 Codex raportoi edistymisestä työn aikana, voit keskeyttää, kysyä kysymyksiä ja säätää suuntaa milloin tahansa menettämättä kontekstia.
Tämä vuorovaikutustapa on enemmän kuin työskentely todellisen kollegan kanssa.

🌐 Verkkosivustojen kehityskyvyn parantaminen
Virallinen esimerkki: GPT-5.3 Codex ja GPT-5.2 Codex tekevät kumpikin SaaS-aloitussivun.
GPT-5.3:n versio:
✅ Muuntaa automaattisesti vuosihinnan keskimääräiseksi kuukausihinnaksi, jotta alennus on intuitiivisempi
✅ Luo automaattisesti pyörivän käyttäjäarviointikomponentin, jossa on kolme erilaista arviota
✅ Kokonaisuus on enemmän kuin suoraan julkaistavissa oleva tuote
GPT-5.2:n versio on suhteellisen yksinkertainen ja vaatii enemmän manuaalista säätöä.
Tämä "käyttäjän aikomuksen ymmärtämisen" kyvyn parantaminen on erittäin hyödyllistä meille, jotka teemme prototyyppejä ja demoja.
🔐 Kyberturvallisuus: Ensimmäinen malli, joka on merkitty "erittäin kyvykkääksi"
Monet eivät ole huomanneet tätä tietoa.
GPT-5.3 Codex on ensimmäinen OpenAI-malli, joka on luokiteltu "High capability" -luokkaan kyberturvallisuustehtävissä.
He ovat erityisesti lanseeranneet Trusted Access for Cyber -ohjelman ja lupaavat investoida 10 miljoonaa dollaria API-määrärahoihin kyberturvallisuuden puolustustutkimuksen tukemiseksi.
AI:n kykyjen rajat laajenevat nopeasti.
📊 Suorituskykyvertailu: Jokaisella on omat vahvuutensa
Terminal-Bench 2.0 (terminaaliohjelmointikyky)
GPT-5.3 Codex: 77,3 % GPT-5.2 Codex: 64,0 % 📈 Parannus: 13,3 prosenttiyksikköä
OSWorld-Verified (tietokoneen käyttökyky)
GPT-5.3 Codex: 64,7 % GPT-5.2 Codex: 38,2 % 📈 Parannus: 26,5 prosenttiyksikköä
Kaiken kaikkiaan GPT-5.3 Codexin terminaalitoiminnot ja tietokoneen käyttökyky ovat parantuneet huomattavasti.

🍺 Moutai-logiikka: Mitä voit saada niiltä ennen kuin ne "kuolevat"?
Kirjoitin jonkin aikaa sitten artikkelin, jossa selitin AI-työkalujen arvoa Duan Yongpingin Moutai-ostojen logiikalla.
Keskeinen näkemys on:
Korvataanko Copilot? Ehkä.
Onko Cursorilla vallihauta? Ei todellakaan syvä.
Onko Claude Code lopullinen muoto? Ei varmasti.
Mutta nämä eivät ole tärkeitä.
Tärkeintä on: kuinka paljon voit saada niiltä ennen kuin ne "kuolevat"?
Nyt Claude Opus 4.6 ja GPT-5.3 Codex ovat täällä, sama kysymys:
Korvataanko nämä kaksi mallia? Varmasti.
Ovatko ne AI:n lopullinen muoto? Ei tietenkään.
Mutta mitä ennen kuin ne korvataan?
Jotkut käyttävät Coworkia parantaakseen suunnitteluasiakirjojen tehokkuutta 10-kertaisesti.
Jotkut käyttävät Claudea Excelissä lyhentääkseen data-analyysin ajan päivästä tuntiin.
Jotkut käyttävät GPT-5.3 Codexin interaktiivista yhteistyötä luodakseen täydellisen SaaS:n viikossa.
Entä sinä? Odotatko edelleen "parempien työkalujen" ilmestymistä?
🎯 Valintasuositukseni
Suunnitteluehdotusten, tuote-esitysten, data-analyysin tekeminen → Claude Opus 4.6
👉 Cowork + Excel/PowerPoint-integraatio, ystävällisempi toimistoympäristöille
Prototyyppien kehittäminen, koodin kirjoittaminen, virheenkorjaus → GPT-5.3 Codex
👉 Vahva terminaalikyky, hyvä vuorovaikutuskokemus, nopea
Käytä molempia → Tämä on minun valintani
👉 Claude tekee alustavan tutkimuksen ja dokumentoinnin, GPT tekee myöhemmän kehityksen ja virheenkorjauksen
On myös realistinen näkökohta: GPT on vakaampi käytössä Kiinassa.

💰 Hinta
Claude Opus 4.6
Syöttö: 5 dollaria / miljoona tokenia Tuloste: 25 dollaria / miljoona tokenia Yli 200 000 tokenin konteksti: 10 dollaria / 37,50 dollaria
GPT-5.3 Codex
API-hintoja ei ole vielä julkistettu Tällä hetkellä käytettävissä ChatGPT Plus/Pro -tilauksella
✨ Lopuksi
Tässä päivityksessä minua kosketti eniten se, että suorituskyky ei ole parantunut niin paljon, vaan AI:n työtapa on muuttumassa.
Claude alkaa käyttää suoraan tiedostojärjestelmääsi.
GPT alkaa keskustella kanssasi työn aikana.
AI alkaa osallistua omaan kehitykseensä.
Vuosi sitten keskustelimme siitä, pystyykö AI kirjoittamaan koodia.
Nyt keskustelemme siitä, pystyykö AI suorittamaan projektin itsenäisesti.
Entä vuoden kuluttua?
En tiedä vastausta.
Mutta tiedän yhden asian: ne, jotka ovat ansainneet rahaa AI-työkaluilla, eivät ole tietämättömiä siitä, että nämä työkalut korvataan.
He ovat vain ymmärtäneet: vaikka se kuolisi myöhemmin, käytetään sitä nyt, kun se on mahdollista.Odottaessasi, että "mietit tarkkaan", bonukset on jo jaettu.





