Claude Opus 4.6 + GPT-5.3 Codex: Mtiririko Wangu wa Kazi wa Mifumo Miwili, Ufanisi Huongezeka Mara Mbili
Je, mko sawa marafiki ambao mmeamka usiku kusubiri kutolewa kwa modeli mpya?
Anthropic na OpenAI zilitolewa modeli zao kuu siku hiyo hiyo. Mzunguko wa marafiki tayari umejaa skrini za kulinganisha alama mbalimbali.
Lakini leo sitaki kuzungumzia alama.
Ninachotaka kuzungumzia ni: Unaweza kupata nini kutoka kwa sasisho hili?
🔥 Kwanza, hebu tuzungumzie undani ambao unanifanya niogope
Kuna sentensi katika blogu rasmi ya OpenAI:
"GPT-5.3-Codex ndiyo modeli yetu ya kwanza kucheza jukumu muhimu katika mchakato wa uumbaji wake yenyewe."
Inamaanisha nini?
Katika mchakato wa kuendeleza GPT-5.3, timu ya OpenAI ilitumia toleo la awali la Codex kuondoa hitilafu katika mchakato wa mafunzo, kusimamia upelekaji, na kuchambua matokeo ya majaribio.
Wao wenyewe walisema "walishangazwa na kiwango ambacho Codex inaweza kuharakisha maendeleo yao wenyewe".
AI imeanza kushiriki katika maendeleo yake yenyewe.
Hii inanikumbusha makala niliyoiandika hapo awali kuhusu Moutai. Wakati huo, nilisema: "Haijalishi kama itakufa baadaye, ikiwa inaweza kutumika sasa, itumie kwanza."
Sasa nataka kusema: Kasi ya mageuzi ya AI inaweza kuwa ya haraka kuliko tunavyofikiria.
Ukisubiri "kufikiria" kabla ya kuchukua hatua, inaweza kuwa imechelewa.
💜 Claude Opus 4.6: Siyo tu nadhifu, lakini inaweza kukusaidia kufanya kazi kweli
Sasisho hili la Anthropic, kichwa cha blogu rasmi ni cha kuvutia sana: "Kuendeleza fedha na Claude Opus 4.6".
Wamefanya uboreshaji maalum kwa sekta ya fedha. Lakini usikimbilie, uwezo huu ni muhimu kwetu pia.
🔧 Cowork: Hatimaye inaweza kuendesha faili za ndani moja kwa moja
Hii ndiyo kazi ninayoingojea zaidi.
Ili kutumia Claude hapo awali, ilibidi unakili na ubandike maudhui ya faili.
Sasa na Cowork, unaweza kuruhusu Claude kufikia moja kwa moja folda kwenye kompyuta yako, inaweza kusoma, kuhariri, na hata kuunda faili mpya.
Fikiria: Unampa folda ya rasimu ya muundo, umruhusu akusaidie kupanga kanuni za kumtaja, kutoa nyaraka za muundo, na hata kuchakata picha kwa wingi.
Hii siyo siku zijazo, ni kazi ambayo inaweza kutumika sasa.

📊 Claude katika Excel na PowerPoint
Anthropic ameweka Claude moja kwa moja kwenye upande wa Excel na PowerPoint.
CTO wa Hebbia alisema: "Ilichukua saa kadhaa kufanya PPT ya kifedha hapo awali, lakini sasa inachukua dakika chache tu."
Kwa wale wetu ambao tunafanya mawasilisho ya bidhaa na mapendekezo ya muundo, hii ni baraka.
Mwanzilishi mwenza wa Shortcut AI alisema: "Kuruka kwa utendaji wa Opus 4.6 karibu haiaminiki. Kazi ambazo Opus 4.5 aliona kuwa ngumu hapo awali sasa zimekuwa rahisi ghafla."
📈 Alama katika uwanja wa fedha
Data rasmi:
Tathmini ya Wakala wa Fedha: 60.7% (ongezeko la 5.47% kutoka Opus 4.5)
TaxEval: 76.0%
Tathmini ya Fedha Halisi: Ongezeko la pointi 23 za asilimia kutoka Sonnet 4.5
Nambari hizi zinaonyesha nini? Claude amekuwa na nguvu kweli katika kushughulikia kazi ngumu ambazo zinahitaji hoja za hatua nyingi.
💚 GPT-5.3 Codex: Njia ya mwingiliano imebadilika, hii ndiyo hatua muhimu
⚡ Kasi imeongezeka kwa 25%, lakini muhimu zaidi ni kwamba njia ya mwingiliano imebadilika
Ili kutumia Codex hapo awali, ilibidi usubiri ikamilike kabla ya kuona matokeo. Unataka kubadilisha mwelekeo? Simamisha na uanze tena.
Sasa ni tofauti.
GPT-5.3 Codex itaripoti maendeleo wakati inafanya kazi, unaweza kuingilia kati, kuuliza maswali, na kurekebisha mwelekeo wakati wowote bila kupoteza muktadha.
Njia hii ya mwingiliano ni kama kushirikiana na mwenzako halisi.

🌐 Uboreshaji wa uwezo wa maendeleo ya tovuti
Afisa alionyesha mfano: Acha GPT-5.3 Codex na GPT-5.2 Codex zifanye ukurasa wa kutua wa SaaS mtawalia.
Toleo la GPT-5.3:
✅ Hubadilisha kiotomatiki bei ya kila mwaka kuwa bei ya wastani ya kila mwezi, na kufanya punguzo kuwa angavu zaidi
✅ Imetengeneza sehemu ya tathmini ya mtumiaji inayozunguka kiotomatiki, na tathmini tatu tofauti
✅ Kwa ujumla, inafanana zaidi na bidhaa ambayo inaweza kuzinduliwa moja kwa moja
Toleo la GPT-5.2 ni rahisi kiasi, na inahitaji marekebisho zaidi ya mwongozo.
Uboreshaji huu wa "kuelewa nia ya mtumiaji" ni muhimu sana kwa wale wetu ambao tunafanya prototypes na demos.
🔐 Usalama wa mtandao: Modeli ya kwanza kuwekwa alama kama "uwezo wa juu"
Habari hii haikuzingatiwa na watu wengi.
GPT-5.3 Codex ndiyo modeli ya kwanza ya OpenAI kuainishwa kama "Uwezo wa Juu" kwenye kazi za usalama wa mtandao.
Wamezindua mpango maalum wa Ufikiaji Unaoaminika kwa Mtandao, na pia wameahidi kuwekeza dola milioni 10 katika posho za API ili kusaidia utafiti wa ulinzi wa usalama wa mtandao.
Mipaka ya uwezo wa AI inaenea haraka.
📊 Ulinganisho wa alama: Kila mmoja ana nguvu zake
Terminal-Bench 2.0 (uwezo wa programu ya terminal)
GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 Ongezeko: pointi 13.3 za asilimia
OSWorld-Imethibitishwa (uwezo wa kuendesha kompyuta)
GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 Ongezeko: pointi 26.5 za asilimia
Kwa ujumla, GPT-5.3 Codex ina uboreshaji mkubwa katika uendeshaji wa terminal na uwezo wa matumizi ya kompyuta.

🍺 Mantiki ya Moutai: Unaweza kupata nini kabla ya "kufa"?
Niliandika makala hapo awali, nikitumia mantiki ya Duan Yongping ya kununua Moutai kuelezea thamani ya zana za AI.
Mtazamo mkuu ni:
Je, Copilot itabadilishwa? Inawezekana.
Je, Cursor ina handaki? Hakika si kirefu.
Je, Claude Code ndiyo fomu ya mwisho? Hakika siyo.
Lakini hizi si muhimu.
Muhimu ni: Unaweza kupata faida ngapi kutoka kwao kabla ya "kufa"?
Sasa Claude Opus 4.6 na GPT-5.3 Codex zimefika, swali lile lile:
Je, modeli hizi mbili zitabadilishwa? Hakika zitabadilishwa.
Je, ndizo fomu ya mwisho ya AI? Bila shaka siyo.
Lakini kabla ya kubadilishwa?
Baadhi ya watu watatumia Cowork kuboresha ufanisi wa nyaraka za muundo kwa mara 10.
Baadhi ya watu watatumia Claude katika Excel kupunguza muda wa uchambuzi wa data kutoka siku moja hadi saa moja.
Baadhi ya watu watatumia ushirikiano shirikishi wa GPT-5.3 Codex kuunda SaaS kamili kwa wiki moja.
Na wewe? Bado unasubiri "zana bora" itoke?
🎯 Mapendekezo yangu ya uchaguzi
Fanya mapendekezo ya muundo, mawasilisho ya bidhaa, uchambuzi wa data → Claude Opus 4.6
👉 Ushirikiano wa Cowork + Excel/PowerPoint, ni rafiki zaidi kwa matukio ya ofisi
Fanya maendeleo ya mfano, uandike msimbo, urekebishe → GPT-5.3 Codex
👉 Uwezo mkubwa wa terminal, uzoefu mzuri wa mwingiliano, kasi ya haraka
Tumia zote mbili → Hii ndiyo chaguo langu
👉 Claude hufanya utafiti wa awali na nyaraka, GPT hufanya maendeleo ya baadaye na urekebishaji
Kuna kuzingatia halisi pia: GPT ni imara zaidi kutumia nchini China.

💰 Bei
Claude Opus 4.6
Ingizo: $5 / milioni tokeni Pato: $25 / milioni tokeni Zaidi ya tokeni 200,000 muktadha: $10 / $37.50
GPT-5.3 Codex
Bei ya API haijatangazwa bado Hivi sasa inapatikana kupitia usajili wa ChatGPT Plus/Pro
✨ Imeandikwa mwishoni
Sasisho hili lilinifanya nihisi sana, siyo ni kiasi gani alama zimeongezeka, lakini njia ya kazi ya AI inabadilika.
Claude anaanza kuendesha moja kwa moja mfumo wako wa faili.
GPT anaanza kuzungumza nawe wakati anafanya kazi.
AI anaanza kushiriki katika maendeleo yake yenyewe.
Mwaka mmoja uliopita, tulikuwa bado tunajadili kama AI inaweza kuandika msimbo.
Sasa, tunajadili kama AI inaweza kukamilisha mradi kwa kujitegemea.
Je, kuhusu mwaka mwingine?
sijui jibu.
Lakini najua jambo moja: Wale wanaopata pesa na zana za AI, hawajui kwamba zana hizi zitabadilishwa.
Wanazielewa tu: Haijalishi kama itakufa baadaye, ikiwa inaweza kutumika sasa, itumie kwanza.Wakati Unapofikiri 'Umeelewa' Mambo, tayari faida imeshagawiwa.





