Claude Opus 4.6 + GPT-5.3 Codex: Kaksoismallityönkulkuni, tehokkuus suoraan kaksinkertaistuu

2/13/2026
5 min read

Oletteko kunnossa, ystävät, jotka valvovat aamuyöhön odottaen uusien mallien julkaisua?

Anthropic ja OpenAI julkaisivat kumpikin lippulaivamallinsa samana päivänä. Ystäväpiiri on jo täynnä erilaisia suorituskykyvertailuja.

Mutta tänään en halua puhua suorituskyvystä.

Haluan puhua siitä: mitä voit saada tästä päivityksestä?

Kaksoismalliyhteistyötyönkulku🔥 Ensin yksityiskohta, joka sai minut kylmäämään

OpenAI:n virallisessa blogissa on lause:

"GPT-5.3-Codex on ensimmäinen mallimme, jolla on ollut merkittävä rooli oman luomisensa prosessissa."

Mitä se tarkoittaa?

OpenAI:n tiimi käytti GPT-5.3:n kehittämisessä Codexin varhaisia versioita virheenkorjaukseen koulutusprosessissa, hallintaan, käyttöönottoon ja testitulosten analysointiin.

He itsekin sanovat olevansa "hämmästyneitä siitä, kuinka paljon Codex pystyi nopeuttamaan heidän omaa kehitystään".

AI on alkanut osallistua omaan kehitykseensä.

Se muistuttaa minua aiemmin kirjoittamastani Moutai-artikkelista. Silloin sanoin: "Vaikka se kuolisi myöhemmin, käytetään sitä nyt, kun se on mahdollista."

Nyt haluan sanoa: AI:n evoluution nopeus voi olla nopeampi kuin luulemme.

Kun olet "ajatellut asian selväksi" ennen kuin toimit, voi olla jo liian myöhäistä.

💜 Claude Opus 4.6: Ei älykkäämpi, vaan todella pystyy auttamaan sinua tekemään töitä

Anthropicin tämänpäiväisen päivityksen virallisen blogin otsikko on mielenkiintoinen: "Advancing finance with Claude Opus 4.6".

He ovat tehneet erityisiä optimointeja rahoitusalalle. Mutta älä hätäile, nämä ominaisuudet ovat hyödyllisiä myös meille.

🔧 Cowork: Vihdoinkin voi suoraan käsitellä paikallisia tiedostoja

Tämä on ominaisuus, jota odotin eniten.

Aiemmin Claudea käytettäessä tiedostojen sisältö piti kopioida ja liittää.

Nyt Coworkin avulla voit antaa Clauden käyttää suoraan tietokoneesi tiettyä kansiota, se voi lukea, muokata ja jopa luoda uusia tiedostoja.

Kuvittele: annat sille suunnitteluluonnosten kansion ja pyydät sitä auttamaan sinua järjestämään nimeämiskäytännöt, luomaan suunnitteluasiakirjoja ja jopa käsittelemään kuvia erissä.

Tämä ei ole tulevaisuutta, vaan ominaisuus, jota voi käyttää nyt.

Cowork-toiminto

📊 Claude Excelissä ja PowerPointissa

Anthropic on sijoittanut Clauden suoraan Excelin ja PowerPointin sivupalkkiin.

Hebbian teknologiajohtaja sanoi: "Aiemmin rahoitus-PPT:n tekemiseen meni tunteja, nyt se on valmis muutamassa minuutissa."

Tämä on suuri apu meille, jotka teemme tuote-esityksiä ja suunnitteluehdotuksia.

Shortcut AI:n toinen perustaja sanoi: "Opus 4.6:n suorituskyvyn harppaus on lähes uskomaton. Tehtävät, jotka Opus 4.5:n mielestä olivat vaikeita, ovat nyt yhtäkkiä helppoja."

📈 Suorituskykyvertailu rahoitusalalla

Viralliset tiedot:

Finance Agent -arviointi: 60,7 % (5,47 % enemmän kuin Opus 4.5)

TaxEval: 76,0 %

Real-World Finance -arviointi: 23 prosenttiyksikköä enemmän kuin Sonnet 4.5

Mitä nämä luvut osoittavat? Claude on todella vahvistunut monimutkaisten, monivaiheista päättelyä vaativien tehtävien käsittelyssä.

💚 GPT-5.3 Codex: Vuorovaikutustapa on muuttunut, se on pääasia

⚡ Nopeus kasvaa 25 %, mutta tärkeämpää on, että vuorovaikutustapa on muuttunut

Aiemmin Codexiä käytettäessä piti odottaa, että se suoritti tehtävänsä, ennen kuin näki tulokset. Haluatko muuttaa suuntaa? Pysäytä ja aloita alusta.

Nyt se on toisin.

GPT-5.3 Codex raportoi edistymisestä työn aikana, voit keskeyttää, kysyä kysymyksiä ja säätää suuntaa milloin tahansa menettämättä kontekstia.

Tämä vuorovaikutustapa on enemmän kuin työskentely todellisen kollegan kanssa.

Vuorovaikutustapojen vertailu

🌐 Verkkosivustojen kehityskyvyn parantaminen

Virallinen esimerkki: GPT-5.3 Codex ja GPT-5.2 Codex tekevät kumpikin SaaS-aloitussivun.

GPT-5.3:n versio:

✅ Muuntaa automaattisesti vuosihinnan keskimääräiseksi kuukausihinnaksi, jotta alennus on intuitiivisempi

✅ Luo automaattisesti pyörivän käyttäjäarviointikomponentin, jossa on kolme erilaista arviota

✅ Kokonaisuus on enemmän kuin suoraan julkaistavissa oleva tuote

GPT-5.2:n versio on suhteellisen yksinkertainen ja vaatii enemmän manuaalista säätöä.

Tämä "käyttäjän aikomuksen ymmärtämisen" kyvyn parantaminen on erittäin hyödyllistä meille, jotka teemme prototyyppejä ja demoja.

🔐 Kyberturvallisuus: Ensimmäinen malli, joka on merkitty "erittäin kyvykkääksi"

Monet eivät ole huomanneet tätä tietoa.

GPT-5.3 Codex on ensimmäinen OpenAI-malli, joka on luokiteltu "High capability" -luokkaan kyberturvallisuustehtävissä.

He ovat erityisesti lanseeranneet Trusted Access for Cyber -ohjelman ja lupaavat investoida 10 miljoonaa dollaria API-määrärahoihin kyberturvallisuuden puolustustutkimuksen tukemiseksi.

AI:n kykyjen rajat laajenevat nopeasti.

📊 Suorituskykyvertailu: Jokaisella on omat vahvuutensa

Terminal-Bench 2.0 (terminaaliohjelmointikyky)

GPT-5.3 Codex: 77,3 % GPT-5.2 Codex: 64,0 % 📈 Parannus: 13,3 prosenttiyksikköä

OSWorld-Verified (tietokoneen käyttökyky)

GPT-5.3 Codex: 64,7 % GPT-5.2 Codex: 38,2 % 📈 Parannus: 26,5 prosenttiyksikköä

Kaiken kaikkiaan GPT-5.3 Codexin terminaalitoiminnot ja tietokoneen käyttökyky ovat parantuneet huomattavasti.

Suorituskykyvertailu

🍺 Moutai-logiikka: Mitä voit saada niiltä ennen kuin ne "kuolevat"?

Kirjoitin jonkin aikaa sitten artikkelin, jossa selitin AI-työkalujen arvoa Duan Yongpingin Moutai-ostojen logiikalla.

Keskeinen näkemys on:

Korvataanko Copilot? Ehkä.

Onko Cursorilla vallihauta? Ei todellakaan syvä.

Onko Claude Code lopullinen muoto? Ei varmasti.

Mutta nämä eivät ole tärkeitä.

Tärkeintä on: kuinka paljon voit saada niiltä ennen kuin ne "kuolevat"?

Nyt Claude Opus 4.6 ja GPT-5.3 Codex ovat täällä, sama kysymys:

Korvataanko nämä kaksi mallia? Varmasti.

Ovatko ne AI:n lopullinen muoto? Ei tietenkään.

Mutta mitä ennen kuin ne korvataan?

Jotkut käyttävät Coworkia parantaakseen suunnitteluasiakirjojen tehokkuutta 10-kertaisesti.

Jotkut käyttävät Claudea Excelissä lyhentääkseen data-analyysin ajan päivästä tuntiin.

Jotkut käyttävät GPT-5.3 Codexin interaktiivista yhteistyötä luodakseen täydellisen SaaS:n viikossa.

Entä sinä? Odotatko edelleen "parempien työkalujen" ilmestymistä?

🎯 Valintasuositukseni

Suunnitteluehdotusten, tuote-esitysten, data-analyysin tekeminen → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint-integraatio, ystävällisempi toimistoympäristöille

Prototyyppien kehittäminen, koodin kirjoittaminen, virheenkorjaus → GPT-5.3 Codex

👉 Vahva terminaalikyky, hyvä vuorovaikutuskokemus, nopea

Käytä molempia → Tämä on minun valintani

👉 Claude tekee alustavan tutkimuksen ja dokumentoinnin, GPT tekee myöhemmän kehityksen ja virheenkorjauksen

On myös realistinen näkökohta: GPT on vakaampi käytössä Kiinassa.

Valintasuositus

💰 Hinta

Claude Opus 4.6

Syöttö: 5 dollaria / miljoona tokenia Tuloste: 25 dollaria / miljoona tokenia Yli 200 000 tokenin konteksti: 10 dollaria / 37,50 dollaria

GPT-5.3 Codex

API-hintoja ei ole vielä julkistettu Tällä hetkellä käytettävissä ChatGPT Plus/Pro -tilauksella

✨ Lopuksi

Tässä päivityksessä minua kosketti eniten se, että suorituskyky ei ole parantunut niin paljon, vaan AI:n työtapa on muuttumassa.

Claude alkaa käyttää suoraan tiedostojärjestelmääsi.

GPT alkaa keskustella kanssasi työn aikana.

AI alkaa osallistua omaan kehitykseensä.

Vuosi sitten keskustelimme siitä, pystyykö AI kirjoittamaan koodia.

Nyt keskustelemme siitä, pystyykö AI suorittamaan projektin itsenäisesti.

Entä vuoden kuluttua?

En tiedä vastausta.

Mutta tiedän yhden asian: ne, jotka ovat ansainneet rahaa AI-työkaluilla, eivät ole tietämättömiä siitä, että nämä työkalut korvataan.

He ovat vain ymmärtäneet: vaikka se kuolisi myöhemmin, käytetään sitä nyt, kun se on mahdollista.Odottaessasi, että "mietit tarkkaan", bonukset on jo jaettu.

Published in Technology

You Might Also Like

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opasTechnology

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opas

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaaTechnology

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaa

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysiTechnology

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi Johdanto Nopean tekoälyn kehityksen myötä AI agentit ovat nousseet ...

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaaliTechnology

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali Nykyään, kun teknologia kehittyy nopea...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...