Claude Opus 4.6 + GPT-5.3 Codex: Ang Aking Dalawahang Modelo ng Daloy ng Trabaho, Doble Agad ang Kahusayan

2/13/2026
7 min read

Mga kaibigan na nagpuyat para hintayin ang paglabas ng bagong modelo, okay lang ba kayo?

Inilabas ng Anthropic at OpenAI ang kani-kanilang flagship models sa parehong araw. Punong-puno na ang mga social media ng iba't ibang paghahambing ng mga score.

Pero hindi ako magtatalakay ng mga score ngayon.

Gusto kong pag-usapan kung ano ang makukuha mo mula sa update na ito?

Daloy ng Trabaho sa Pagtutulungan ng Dalawang Modelo🔥 Una, isang detalye na nagpataas ng balahibo ko

May isang pangungusap sa opisyal na blog ng OpenAI:

"Ang GPT-5.3-Codex ang aming unang modelo na gumanap ng mahalagang papel sa paglikha ng sarili nito."

Anong ibig sabihin nito?

Ginamit ng team ng OpenAI ang mas naunang bersyon ng Codex para i-debug ang proseso ng pagsasanay, pamahalaan ang deployment, at suriin ang mga resulta ng pagsubok sa proseso ng pagbuo ng GPT-5.3.

Sabi pa nila na "namangha sila sa kung paano napabilis ng Codex ang kanilang sariling pag-unlad."

Nagsimula nang makilahok ang AI sa sarili nitong pag-unlad.

Naalala ko ang artikulo tungkol sa Moutai na isinulat ko dati. Sabi ko noon: "Hindi mahalaga kung mamamatay ito sa hinaharap, gamitin na natin ito habang nagagamit pa."

Gusto kong sabihin ngayon: Ang bilis ng ebolusyon ng AI ay maaaring mas mabilis kaysa sa inaakala natin.

Kapag "naisip" mo na at kumilos, maaaring huli na.

💜 Claude Opus 4.6: Hindi lang mas matalino, talagang makakatulong sa iyo sa trabaho

Nakakatuwa ang pamagat ng opisyal na blog ng Anthropic sa update na ito: "Advancing finance with Claude Opus 4.6".

Espesyal silang gumawa ng mga pag-optimize para sa industriya ng pananalapi. Pero huwag kang magmadaling umalis, kapaki-pakinabang din ang mga kakayahang ito para sa atin.

🔧 Cowork: Sa wakas, direktang makakapag-operate ng mga lokal na file

Ito ang pinakahihintay kong feature.

Dati, kapag gumagamit ng Claude, kailangan mong kopyahin at i-paste ang nilalaman ng file.

Ngayon, sa Cowork, maaari mong hayaan ang Claude na direktang i-access ang isang folder sa iyong computer, mababasa, ma-e-edit, at makakalikha pa ito ng mga bagong file.

Guni-gunihin: ibibigay mo sa kanya ang folder ng iyong mga draft ng disenyo, at hayaan mo siyang tulungan kang ayusin ang mga pamantayan sa pagpapangalan, bumuo ng mga dokumento ng disenyo, at kahit na mag-batch process ng mga larawan.

Hindi ito hinaharap, isa itong feature na magagamit na ngayon.

Feature ng Cowork

📊 Claude sa Excel at PowerPoint

Direktang isiniksik ng Anthropic ang Claude sa sidebar ng Excel at PowerPoint.

Sabi ng CTO ng Hebbia: "Dati, inaabot ng ilang oras para gumawa ng financial PPT, pero ngayon ilang minuto lang."

Isa itong malaking tulong para sa atin na gumagawa ng mga ulat ng produkto at mga panukala sa disenyo.

Sabi ng co-founder ng Shortcut AI: "Halos hindi kapani-paniwala ang pagtalon sa performance ng Opus 4.6. Ang mga gawaing dati'y mahirap para sa Opus 4.5 ay biglang naging madali."

📈 Mga score sa larangan ng pananalapi

Opisyal na datos:

Pagtataya ng Finance Agent: 60.7% (5.47% na pagtaas kumpara sa Opus 4.5)

TaxEval: 76.0%

Pagtataya ng Real-World Finance: 23 puntos na mas mataas kaysa sa Sonnet 4.5

Ano ang ibig sabihin ng mga numerong ito? Tiyak na mas lumakas ang Claude sa paghawak ng mga kumplikado at nangangailangan ng maraming hakbang na gawain.

💚 GPT-5.3 Codex: Nagbago ang paraan ng pakikipag-ugnayan, iyon ang mahalaga

⚡ 25% na pagbilis, pero mas mahalaga ang pagbabago sa paraan ng pakikipag-ugnayan

Dati, kapag gumagamit ng Codex, kailangan mong hintayin itong matapos bago mo makita ang mga resulta. Gusto mong baguhin ang direksyon? Itigil at ulitin.

Iba na ngayon.

Ang GPT-5.3 Codex ay mag-uulat ng progreso habang nagtatrabaho, maaari kang sumingit, magtanong, at ayusin ang direksyon anumang oras, nang hindi nawawala ang konteksto.

Ang ganitong paraan ng pakikipag-ugnayan ay mas katulad ng pakikipagtulungan sa isang tunay na kasamahan.

Paghahambing ng Paraan ng Pakikipag-ugnayan

🌐 Pagpapabuti sa kakayahan sa pagbuo ng website

Nagpakita ang opisyal ng isang halimbawa: Hayaan ang GPT-5.3 Codex at GPT-5.2 Codex na gumawa ng isang SaaS landing page.

Bersyon ng GPT-5.3:

✅ Awtomatikong kinokonvert ang taunang presyo sa average na buwanang presyo, para mas maging malinaw ang diskwento

✅ Gumawa ng isang awtomatikong carousel ng mga testimonial ng user, na may tatlong magkakaibang testimonial

✅ Sa pangkalahatan, mas katulad ito ng isang produkto na maaaring direktang ilunsad

Ang bersyon ng GPT-5.2 ay medyo simple at nangangailangan ng mas maraming manu-manong pagsasaayos.

Ang pagpapabuti na ito sa kakayahang "maunawaan ang layunin ng user" ay napaka-praktikal para sa atin na gumagawa ng mga prototype at demo.

🔐 Seguridad sa network: Ang unang modelo na minarkahan bilang "mataas ang kakayahan"

Maraming tao ang hindi nakapansin sa impormasyong ito.

Ang GPT-5.3 Codex ang unang modelo ng OpenAI na inuri bilang "High capability" sa mga gawain sa seguridad sa network.

Espesyal silang naglunsad ng Trusted Access for Cyber program, at nangako rin silang mamuhunan ng $10 milyon sa API credits upang suportahan ang pananaliksik sa pagtatanggol sa seguridad sa network.

Mabilis na lumalawak ang mga hangganan ng kakayahan ng AI.

📊 Paghahambing ng mga score: May kanya-kanyang lakas

Terminal-Bench 2.0 (kakayahan sa terminal programming)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 Pagtaas: 13.3 puntos

OSWorld-Verified (kakayahang mag-operate ng computer)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 Pagtaas: 26.5 puntos

Sa pangkalahatan, malaki ang pagpapabuti ng GPT-5.3 Codex sa pagpapatakbo ng terminal at paggamit ng computer.

Paghahambing ng mga Score

🍺 Lohika ng Moutai: Ano ang makukuha mo bago sila "mamatay"?

Sumulat ako ng isang artikulo kamakailan, gamit ang lohika ni Duan Yongping sa pagbili ng Moutai upang ipaliwanag ang halaga ng mga tool ng AI.

Ang pangunahing punto ay:

Papalitan ba ang Copilot? Maaari.

Mayroon bang moat ang Cursor? Hindi talaga malalim.

Ang Claude Code ba ang ultimate form? Tiyak na hindi.

Pero hindi mahalaga ang mga iyon.

Ang mahalaga ay: Gaano karaming mga benepisyo ang makukuha mo mula sa kanila bago sila "mamatay"?

Ngayon, dumating na ang Claude Opus 4.6 at GPT-5.3 Codex, parehong tanong:

Papalitan ba ang dalawang modelong ito? Tiyak.

Sila ba ang ultimate form ng AI? Siyempre hindi.

Pero bago sila mapalitan?

May gagamit ng Cowork para mapataas ng 10 beses ang kahusayan ng mga dokumento ng disenyo.

May gagamit ng Claude sa Excel para paikliin ang oras ng pagsusuri ng datos mula isang araw hanggang isang oras.

May gagamit ng interactive collaboration ng GPT-5.3 Codex para gumawa ng isang kumpletong SaaS sa loob ng isang linggo.

Ikaw naman? Naghihintay ka pa rin ng "mas magandang tool"?

🎯 Ang aking mga rekomendasyon

Gumawa ng mga panukala sa disenyo, mga ulat ng produkto, pagsusuri ng datos → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint integration, mas madaling gamitin sa mga sitwasyon sa opisina

Gumawa ng prototype development, magsulat ng code, mag-debug → GPT-5.3 Codex

👉 Malakas ang kakayahan sa terminal, maganda ang interactive experience, mabilis

Gamit ang pareho → Ito ang pinili ko

👉 Gumamit ng Claude para sa paunang pananaliksik at dokumentasyon, at gumamit ng GPT para sa huling development at pag-debug

May isa pang praktikal na konsiderasyon: Mas stable ang paggamit ng GPT sa Pilipinas.

Mga Rekomendasyon

💰 Presyo

Claude Opus 4.6

Input: $5 / milyon token Output: $25 / milyon token Higit sa 200,000 token na konteksto: $10 / $37.50

GPT-5.3 Codex

Hindi pa inaanunsyo ang presyo ng API Sa kasalukuyan, magagamit sa pamamagitan ng subscription sa ChatGPT Plus/Pro

✨ Huling tala

Ang pinakanaramdaman ko sa update na ito ay hindi kung gaano tumaas ang score, kundi ang pagbabago sa paraan ng pagtatrabaho ng AI.

Nagsimula nang direktang mag-operate ang Claude sa iyong file system.

Nagsimula nang makipag-usap sa iyo ang GPT habang nagtatrabaho.

Nagsimula nang makilahok ang AI sa sarili nitong pag-unlad.

Isang taon na ang nakalipas, pinag-uusapan pa natin kung kaya bang magsulat ng code ang AI.

Ngayon, pinag-uusapan natin kung kaya bang kumpletuhin ng AI ang isang proyekto nang mag-isa.

Sa susunod na taon?

Hindi ko alam ang sagot.

Pero alam ko ang isang bagay: Ang mga taong kumita ng pera gamit ang mga tool ng AI ay hindi ignorante na mapapalitan ang mga tool na ito.

Naisip lang nila: Hindi mahalaga kung mamamatay ito sa hinaharap, gamitin na natin ito habang nagagamit pa.等到你「想清楚」的时候,红利已经被瓜分完了。

Published in Technology

You Might Also Like