Claude Code vs Codex: Nimeangalia majaribio ya dakika 38, tofauti ni kubwa kuliko nilivyofikiria
Claude Code vs Codex: Nimeangalia majaribio ya dakika 38, tofauti ni kubwa kuliko nilivyofikiria
Kwanza, hebu nianze na hitimisho: Ikiwa wewe ni mendezi huru, au unahitaji kubadilisha mawazo yako kuwa bidhaa haraka, chagua Claude Code. Hakuna haja ya kujiuliza sana.
Mimi kwa kawaida natumia Claude Code, Codex ni chombo ninachofungua mara chache tu kujaribu. Upendeleo huu si wa kufuata mtindo, Claude Code inapata sasisho haraka sana, mwanzilishi Boris Churney mara nyingi hushiriki kwenye Twitter uzoefu wa timu yake ikitumia katika maendeleo halisi. Si demo, ni kitu kinachofanya kazi katika mazingira ya uzalishaji.
Codex je? Uwezo wake ni mkubwa, nimejaribu kufanya programu kadhaa ndogo. Katika mzunguko, kuna watu wanasema kuwa kufanya kazi za nyuma, na usalama ni bora kutumia Codex.
Mwanzilishi wa Clawdbot Peter Steinberger anasema, alitumia takriban siku 10 vibe coding kuunda prototype ya Clawdbot, akitegemea hasa Claude Code na Codex katika maendeleo, ambapo uandishi wa msimbo mgumu na sehemu kuu alitegemea zaidi Codex.
Basi kati ya hizi mbili, ni nani anayefaa zaidi kama chombo cha programu za AI? Hapo awali sikuwa na uhakika.
Mpaka nilipokutana na majaribio haya.
Blogger wa kigeni Mansel Scheffel alifanya jaribio gumu sana: alitoa zana mbili zikiwa na prompt sawa kabisa, akawaacha wajenge programu kutoka sifuri, na kupeleka mtandaoni. Alirekodi kila hatua, dakika 38.
I. Mpangilio wa Jaribio: Mshindani wa Haki Kamili
Kazi ni rahisi lakini pia kamili: kujenga programu ya uchambuzi wa taarifa za ushindani inayoitwa "Rival"
Mtumiaji anaingiza URL ya kampuni, programu inachukua moja kwa moja taarifa za kampuni hiyo na washindani wake, ikitengeneza ripoti kamili ya uchambuzi wa ushindani. Uchambuzi huu ukifanya na kampuni ya ushauri, itakugharimu angalau dola 10,000.
Teknolojia: Supabase (database + uthibitisho) + Firecrawl (kuvuta tovuti) + Vercel (kupeleka)
Kanuni: maneno ya kuashiria sawa kabisa, hakuna vidokezo vya ziada, angalia ni nani anayeweza kukamilisha kwa uhuru
II. Kiwango cha Kwanza: Awamu ya Mpango
Codex mara moja ilikuuliza maswali kumi na kadhaa.
- Nani ni mtumiaji wa lengo?
- Unatumia mfano gani kufanya uchambuzi?
- Uthibitisho wa njia unachagua ipi?
- Mtindo wa UI unaunda vipi?
- Kiwango cha matumizi cha kawaida unakipangia kiasi gani?
Alianza moja kwa moja kuandika msimbo.
Maoni ya blogger yalikuwa sahihi: "Codex ni kama mwanafunzi makini, Claude Code ni kama mtaalamu mwenye kujiamini."
III. Kiwango cha Pili: Kasi ya Ujenzi
Kisha ni kusubiri kwa muda mrefu.
- Claude Code: Takriban saa 1 kumaliza
- Codex: Zaidi ya saa 2, bado inaendelea
IV. Kiwango cha Tatu: Ulinganisho wa Ubora wa UI
Baada ya pande zote mbili kupelekwa, blogger alifungua kiolesura kulinganisha.
Kiolesura cha Claude Code: si cha kushangaza, lakini kinaweza kutumika. Mpangilio ni wa mantiki, font ni ya kawaida.
Kiolesura cha Codex: blogger alilalamika mara moja——
"Kwa kweli, kiolesura hiki ni kibaya sana. Mwaka 2026, vipi unaweza kuunda font na nafasi kama hizi?"
V. Kiwango cha Nne: Jaribio la Kazi
Mtihani halisi umefika: acha pande zote mbili zianalyze ClickUp.
Claude Code:
Kwanza ilikosea. Lakini kurekebisha ilikuwa haraka, dakika chache kutambua tatizo (mipangilio ya uthibitisho wa JWT), ilirekebishwa ndani ya dakika 4.
Baada ya kurekebisha, ilifanikiwa kuvuta ClickUp na washindani wake: Monday, Notion, Asana, Atlassian. Ripoti pia ilitengenezwa.
Codex:
Ilikutana na kosa sawa.
Ilitumia dakika 19 tu kutafuta tatizo.
Baada ya kurekebisha bado haikufanya kazi. Blogger alisubiri kwa muda mrefu, mwishowe alikata tamaa.
VI. Kiwango cha Tano: Tathmini ya Tatu
Blogger alialika Gemini Pro 3 kufanya tathmini ya vipande viwili vya msimbo. Kipengele hiki kina mvuto.
Katika usalama wa nyuma: Codex ilishinda
Gemini iliona kuwa muundo wake wa usalama ni wa hali ya juu: sera kamili ya usalama wa kiwango (RLS), kumbukumbu za ukaguzi zisizoweza kubadilishwa, mifano ya ruhusa imefanywa vizuri zaidi. Hii pia inathibitisha mtazamo katika mzunguko——kufanya kazi za nyuma, na usalama, Codex kweli ina mfumo mzuri.
Katika ubora wa mbele: Claude Code ilishinda kwa urahisi
Ukamilifu wa msimbo, uwazi wa mantiki, ubora wa utekelezaji wa UI, vyote ni bora zaidi.
Muhtasari wa blogger ni wa moja kwa moja:
"Unaweza kunishawishi kuwa Codex ni salama zaidi, lakini huwezi kunishawishi kutumia. Kwa sababu uzoefu wake wa mtumiaji ni mbaya sana. Chombo ambacho hakiwezi hata kutekeleza kazi za msingi, ni salama kiasi gani ina maana gani?"
VII. Muhtasari wa Tofauti Kuu
Baada ya kuangalia majaribio haya, mawazo yangu yamebadilika kidogo.
Awali nilidhani zana hizi zina faida na hasara, kuchagua ipi inategemea hali. Sasa nadhani, ikiwa wewe ni mendezi huru, au unahitaji kuthibitisha mawazo haraka, kujenga MVP, ufanisi na uaminifu wa Claude Code ni bora zaidi. Wakati ni pesa, wakati Codex inakufanya uulize swali la kumi, Claude Code inaweza kuwa tayari inafanya kazi.
Lakini ikiwa unafanya kazi ya nyuma ya kiwango cha biashara, na unahitaji usalama mkali, Codex inastahili kuzingatiwa. Masharti ni lazima uwe na uvumilivu.

