Claude Code vs Codex: Ég horfði á 38 mínútna raunpróf, munurinn er meiri en ég hélt

2/25/2026
5 min read

Claude Code vs Codex: Ég horfði á 38 mínútna raunpróf, munurinn er meiri en ég hélt

Fyrst um sinn niðurstaðan: Ef þú ert sjálfstæður forritari, eða þarft að breyta hugmyndum í vöru hratt, veldu Claude Code. Það er ekkert að velta sér upp úr því.

Ég nota venjulega Claude Code, Codex er bara opnað af og til til að prófa. Þessi smekkur er ekki bara að fylgja straumnum, Claude Code uppfærir of hratt, stofnandi Boris Churney deilir oft reynslu teymisins af því að nota það í raunverulegum þróun. Þetta er ekki demo, þetta er raunverulegt sem keyrir í framleiðsluumhverfi.

En Codex? Getan er vissulega sterk, ég hef unnið að nokkrum smáforritum. Í kringum mig segja sumir að Codex sé betra fyrir bakenda og öryggisvinnu.

Stofnandi Clawdbot, Peter Steinberger, sagði að hann hefði eytt um 10 dögum í vibe coding til að búa til frumgerð Clawdbot, aðallega með því að treysta á Claude Code og Codex í þróun, þar sem hann treysti meira á Codex fyrir flókin kóðun og kjarnaþætti.

Svo hver er raunverulega betri sem AI forritunartæki? Ég var ekki viss áður.

Þangað til ég sá þetta raunpróf.

Útlensk bloggari, Mansel Scheffel, gerði mjög krafna tilraun: gaf báðum verkfærum nákvæmlega sama prompt, lét þau byggja upp forrit frá grunni og setja það í notkun. Allt var tekið upp, 38 mínútur.

I. Tilraunastilling: Alveg sanngjarn keppni

Verkefnið var mjög einfalt en einnig mjög fullkomið: byggja upp forrit sem heitir "Rival" fyrir greiningu á samkeppni.

Notandi slær inn URL fyrirtækis, forritið grípur sjálfkrafa upplýsingar um það fyrirtæki og keppinauta þess, og býr til fullkomna samkeppnisgreiningu. Ef þú myndir leita að ráðgjafafyrirtæki til að gera þessa greiningu, myndirðu þurfa að eyða að minnsta kosti 10.000 dollurum.

Tæknistack: Supabase (gagnagrunnur + auðkenning) + Firecrawl (vefsíður) + Vercel (setja upp)

Reglur: Nákvæmlega sömu leiðbeiningar, engar auka leiðbeiningar, sjá hver getur lokið verkefninu sjálfstætt.

II. Fyrsta umferð: Skipulagningarfasi

Codex byrjaði strax að spyrja þig um tíu spurningar.

  • Hver er markhópurinn?
  • Hvaða líkan er notað til greiningar?
  • Hvaða auðkenningaraðferð er valin?
  • Hvernig á að ákveða UI stíl?
  • Hvað á að setja í hámark notkun?
Hvað með Claude Code? Ekki spurði það eina spurningu.

Bara byrjaði að skrifa kóða.

Mat bloggara var mjög viðeigandi: "Codex er eins og varkár starfsnemi, Claude Code er eins og sjálfsöruggur reyndur maður."

III. Önnur umferð: Byggingarhraði

Síðan kom langur biðtími.

  • Claude Code: Um 1 klukkustund til að klára
  • Codex: Yfir 2 klukkustundir, enn að halda áfram
Ég skrifaði niður orð bloggara: "Ég hef verið hérna í 2 klukkustundir og 34 mínútur, mestan hluta tímans að bíða eftir Codex."

IV. Þriðja umferð: UI gæðamunur

Eftir að báðir aðilar voru settir upp, opnaði bloggari viðmótið til að bera saman.

UI Claude Code: Ekki ótrúlegt, en nothæft. Uppsetningin er skynsamleg, letur er eðlilegt.

UI Codex: Bloggarinn kvartaði strax -

"Satt að segja, þetta viðmót er of ljótt. Það er árið 2026, hvernig geturðu búið til svona letur og bil?"

V. Fjórða umferð: Virkni prófun

Raunveruleg prófunin kom: láttu báða aðila greina ClickUp.

Claude Code:

Fyrsta skiptin fékk villu. En lagfæringin var fljótleg, nokkrar mínútur til að finna vandamálið (JWT staðfestingarstilling), lagfært innan 4 mínútna.

Eftir að hafa lagað það tókst að grípa ClickUp og keppinauta þess: Monday, Notion, Asana, Atlassian. Skýrslan var einnig búin til.

Codex:

Mættur sömu villu.

Eyddi 19 mínútum í að finna vandamálið.

Eftir að hafa lagað það virkaði það samt ekki. Bloggarinn beið lengi, að lokum gafst hann upp.

VI. Fimmta umferð: Þriðja aðila mat

Bloggarinn fékk Gemini Pro 3 til að blindprófa tvö kóðasöfn. Þessi hluti var nokkuð áhugaverður.

Í bakenda öryggismálum: Codex vann.

Gemini taldi að öryggistrúnaðurinn væri þroskaðri: fullkomin línuleg öryggisstefna (RLS), óbreytanleg skráning, heimildarmódel voru öll betri. Þetta staðfestir einnig skoðanir í kringum - fyrir bakenda og öryggisvinnu, Codex hefur vissulega kerfi.

Í gæðum framenda: Claude Code vann örugglega.

Heildar kóðagæði, skýrleiki í rökfræði, gæði UI útfærslu, voru öll greinilega betri.

Samantekt bloggara var mjög beinskeytt:

"Þú getur sannfært mig um að Codex sé öruggara, en þú getur ekki sannfært mig um að nota það. Vegna þess að notendaupplifunin er of léleg. Tæki sem getur ekki einu sinni uppfyllt grunnvirkni, hvað þýðir það að vera öruggt?"

VII. Samantekt á kjarna muninum

Eftir að hafa séð þetta raunpróf, breyttist hugsun mín aðeins.

Fyrir var ég að hugsa að báðir verkfærin hefðu sína kosti og galla, hvaða val væri háð aðstæðum. Nú tel ég að ef þú ert sjálfstæður forritari, eða þarft að staðfesta hugmyndir hratt, þá er skilvirkni og áreiðanleiki Claude Code betri. Tími er peningar, þegar Codex spyr þig um tíundu spurninguna, gæti Claude Code þegar verið að keyra.

En ef þú ert að vinna að fyrirtækjaskipulagi með ströngum öryggiskröfum, þá er Codex þess virði að íhuga. Skilyrðið er að þú þurfir að hafa þolinmæði.

Heimildaskjal

  • YouTube myndband: Claude Code vs Codex Head-to-Head eftir Mansel Scheffel (tengill)
  • Prófskjal: Google Drive - Allir kóðar og stillingar (tengill)
Published in Technology

You Might Also Like