Claude Code vs Codex: Po 38 minutah testiranja sem ugotovil, da je razlika večja, kot sem si predstavljal
Claude Code vs Codex: Po 38 minutah testiranja sem ugotovil, da je razlika večja, kot sem si predstavljal
Najprej zaključek: če si samostojni razvijalec ali potrebuješ hitro pretvorbo ideje v izdelek, izberi Claude Code. Ničesar ni treba preveč razmišljati.
Običajno uporabljam Claude Code, Codex pa le občasno preizkusim. Ta preferenca ni le modna muha, Claude Code se prehitro posodablja, ustanovitelj Boris Churney pogosto deli izkušnje ekipe na Twitterju, kako ga uporabljajo za pravo razvojno delo. Ni to le demo, temveč resnično delujoča rešitev v produkcijskem okolju.
Kaj pa Codex? Zmožnosti so res močne, sam sem naredil nekaj manjših programov. V krogu se govori, da je za backend in varnost bolj primeren Codex.
Ustanovitelj Clawdbota Peter Steinberger je dejal, da je v približno 10 dneh vibe codinga ustvaril prototip Clawdbota, predvsem z uporabo Claude Code in Codex za razvoj, pri čemer se je za kompleksno kodiranje in jedrne dele bolj zanašal na Codex.
Kdo od obeh je torej bolj primeren kot orodje za programiranje z umetno inteligenco? Tudi sam prej nisem bil prepričan.
Dokler nisem videl tega testa.
Tuji bloger Mansel Scheffel je izvedel zelo rigorozni eksperiment: obema orodjema je dal popolnoma enak prompt in ju prosil, naj zgradita aplikacijo od nič, ki jo je treba implementirati. Celoten postopek je posnel, trajal je 38 minut.
I. Eksperimentalna nastavitev: popolnoma pošten dvoboj
Naloga je zelo preprosta, a tudi popolna: zgraditi aplikacijo za analizo konkurenčnih informacij, imenovano "Rival".
Uporabnik vnese URL podjetja, aplikacija samodejno zajame informacije o tem podjetju in njegovih konkurentih ter ustvari popolno analizo konkurence. Takšna analiza bi pri svetovalni družbi stala vsaj 10.000 dolarjev.
Tehnološki sklad: Supabase (baza podatkov + avtentikacija) + Firecrawl (zajemanje spletnih strani) + Vercel (implementacija)
Pravila: popolnoma enaki pozivi, brez dodatnih namigov, da vidimo, kdo lahko samostojno dokonča nalogo.
II. Prva runda: faza načrtovanja
Codex takoj postavi desetine vprašanj.
- Kdo je ciljna publika?
- Kateri model se uporablja za analizo?
- Katero metodo avtentikacije izbrati?
- Kako določiti slog UI?
- Kakšna naj bo privzeta omejitev uporabe?
Takoj se je lotil pisanja kode.
Blogerjeva ocena je zelo natančna: "Codex je kot previden pripravnik, Claude Code pa kot samozavesten veteran."
III. Druga runda: hitrost gradnje
Nato je prišlo do dolgega čakanja.
- Claude Code: približno 1 ura za dokončanje
- Codex: več kot 2 uri, še vedno nadaljuje
IV. Tretja runda: primerjava kakovosti UI
Ko sta bili obe strani implementirani, je bloger odprl vmesnik za primerjavo.
Vmesnik Claude Code: ni osupljiv, a deluje. Postavitev je smiselna, pisava normalna.
Vmesnik Codex: bloger je takoj komentiral —
"Resno, ta vmesnik je pregrd. Leta 2026, kako lahko generiraš takšno pisavo in razmik?"
V. Četrta runda: testiranje funkcionalnosti
Pravi preizkus je prišel: naj obe strani analizirata ClickUp.
Claude Code:
Prvič je prišlo do napake. A popravilo je bilo hitro, v nekaj minutah je našel težavo (konfiguracija JWT avtentikacije), v 4 minutah je bilo popravilo končano.
Po popravilu je uspešno zajel ClickUp in njegove konkurente: Monday, Notion, Asana, Atlassian. Tudi poročilo je bilo ustvarjeno.
Codex:
Se je srečal s podobno napako.
Porabil je 19 minut, da je našel težavo.
Po popravilu pa še vedno ni delovalo. Bloger je čakal še dolgo, na koncu pa obupal.
VI. Peta runda: neodvisna ocena
Bloger je povabil Gemini Pro 3, da neodvisno oceni oba repozitorija kode. Ta del je bil zelo zanimiv.
Na področju varnosti backend: Codex je zmagal.
Gemini meni, da je njegova varnostna arhitektura bolj zrela: celovite strategije varnosti na ravni vrstic (RLS), nepremične revizijske sledi, avtentikacijski modeli so boljši. To potrjuje tudi mnenje v krogu — za backend in varnost, Codex res ima svoj sistem.
Na področju kakovosti frontend: Claude Code je zlahka zmagal.
Celovitost kode, jasnost logike, kakovost implementacije UI so očitno boljše.
Blogerjeva ocena je zelo neposredna:
"Lahko me prepričaš, da je Codex bolj varen, a me ne moreš prepričati, da ga uporabljam. Ker je uporabniška izkušnja preprosto slaba. Orodje, ki ne more izvesti niti osnovnih funkcij, kakšen smisel ima, če je še tako varno?"
VII. Povzetek ključnih razlik
Po tem testu so se moje misli nekoliko spremenile.
Prej sem menil, da imata oba orodja svoje prednosti in slabosti, izbira pa je odvisna od situacije. Zdaj menim, da če si samostojni razvijalec ali potrebuješ hitro preverjanje idej, ter gradnjo MVP, je učinkovitost in zanesljivost Claude Code boljša. Čas je denar, ko Codex postavi tvoje deseto vprašanje, je Claude Code morda že zagnan.
Toda če delaš na podjetniškem backendu in imaš stroge zahteve glede varnosti, je Codex vreden razmisleka. Pod pogojem, da imaš potrpljenje.

