Claude Code vs Codex: Jeg så på 38 minutters testing, forskjellen er større enn forventet

2/25/2026
5 min read

Claude Code vs Codex: Jeg så på 38 minutters testing, forskjellen er større enn forventet

Først konklusjonen: Hvis du er en uavhengig utvikler, eller trenger å raskt omgjøre ideer til produkter, velg Claude Code. Det er ikke noe å dvele ved.

Jeg bruker vanligvis Claude Code, Codex åpner jeg bare av og til for å prøve. Denne preferansen er ikke bare en trend; Claude Code oppdateres så raskt, grunnlegger Boris Churney deler ofte erfaringer fra teamet som bruker det til ekte utvikling på Twitter. Det er ikke en demo, det er ekte ting som kjører i produksjonsmiljøer.

Og Codex? Evnene er absolutt sterke, jeg har laget noen små programmer med det. Det er folk i miljøet som sier at Codex er mer passende for backend og sikkerhet.

Grunnleggeren av Clawdbot, Peter Steinberger, sa at han brukte omtrent 10 dager på vibe coding for å lage prototypen av Clawdbot, hovedsakelig avhengig av Claude Code og Codex for utviklingen, hvor han i større grad stole på Codex for kompleks koding og kjernefunksjoner.

Så hvem av disse to er egentlig bedre som AI-programmeringsverktøy? Jeg var tidligere usikker.

Inntil jeg så denne testen.

Den utenlandske bloggeren Mansel Scheffel gjorde et veldig hardcore eksperiment: han ga de to verktøyene helt identiske prompt og ba dem bygge en applikasjon fra bunnen av og distribuere den. Hele prosessen ble filmet, 38 minutter.

I. Eksperimentoppsett: En helt rettferdig duell

Oppgaven er enkel, men også fullstendig: Bygg en applikasjon kalt "Rival" for analyse av konkurranseinformasjon.

Brukeren skriver inn selskapets URL, applikasjonen henter automatisk informasjon om selskapet og dets konkurrenter, og genererer en fullstendig konkurranseanalyse. En slik analyse ville koste minst 10 000 dollar hvis man skulle få et konsulentselskap til å gjøre det.

Teknologisk stakk: Supabase (database + autentisering) + Firecrawl (web scraping) + Vercel (distribusjon)

Regler: Helt identiske prompt, ingen ekstra hint, se hvem som kan fullføre uavhengig.

II. Første runde: Planleggingsfase

Codex begynner med å stille deg ti spørsmål.

  • Hvem er målgruppen?
  • Hvilken modell skal brukes til analysen?
  • Hvilken autentiseringsmetode skal velges?
  • Hvordan skal UI-stilen bestemmes?
  • Hva skal standard bruksgrense settes til?
Hva med Claude Code? Det stilte ikke ett spørsmål.

Det begynte rett på koding.

Bloggerens vurdering var treffende: "Codex er som en forsiktig praktikant, Claude Code er som en selvsikker veteran."

III. Andre runde: Byggehastighet

Så begynte den lange ventetiden.

  • Claude Code: Ca. 1 time for å fullføre
  • Codex: Over 2 timer, fortsatt i gang
Bloggerens egne ord: "Jeg har sittet her i 2 timer og 34 minutter, mesteparten av tiden har jeg ventet på Codex."

IV. Tredje runde: UI-kvalitet sammenligning

Etter at begge sider var distribuert, åpnet bloggeren grensesnittet for sammenligning.

Claude Codes grensesnitt: Ikke imponerende, men brukbart. Layouten er rimelig, skrifttypen normal.

Codex sitt grensesnitt: Bloggeren klaget umiddelbart –

"For å være ærlig, dette grensesnittet er stygt. Det er 2026, hvordan kan man generere så dårlig skrifttype og avstand?"

V. Fjerde runde: Funksjonstest

Den virkelige testen kom: La begge sider analysere ClickUp.

Claude Code:

Første gang fikk jeg en feil. Men reparasjonen gikk raskt, problemet ble lokalisert på noen minutter (JWT-valideringskonfigurasjon), og det ble fikset innen 4 minutter.

Etter å ha fikset det, klarte den å hente ClickUp og dets konkurrenter: Monday, Notion, Asana, Atlassian. Rapporten ble også generert.

Codex:

Møtte den samme feilen.

Det tok 19 minutter å finne problemet.

Etter å ha fikset det, fungerte det fortsatt ikke. Bloggeren ventet lenge igjen, og ga til slutt opp.

VI. Femte runde: Tredjeparts vurdering

Bloggeren ba Gemini Pro 3 om å blindvurdere de to kodebasene. Dette segmentet var ganske interessant.

Når det gjelder backend-sikkerhet: Codex vant.

Gemini mente at dens sikkerhetsarkitektur var mer moden: fullstendig radnivå sikkerhetspolitikk (RLS), uforanderlige revisjonslogger, autorisasjonsmodeller er alle bedre implementert. Dette bekrefter også oppfatningen i miljøet – for backend og sikkerhet, har Codex absolutt en metode.

Når det gjelder frontend-kvalitet: Claude Code vant klart.

Kodeintegritet, logisk klarhet, UI-implementeringskvalitet, er alle betydelig bedre.

Bloggerens oppsummering var direkte:

"Du kan overbevise meg om at Codex er sikrere, men du kan ikke overbevise meg om å bruke det. Fordi brukeropplevelsen er så dårlig. Et verktøy som ikke engang kan oppfylle grunnleggende funksjoner, hva er poenget med å være sikkert?"

VII. Oppsummering av kjerneforskjeller

Etter å ha sett denne testen, har tankene mine endret seg litt.

Tidligere trodde jeg at begge verktøyene hadde sine fordeler og ulemper, og at valget avhenger av scenariet. Nå mener jeg at hvis du er en uavhengig utvikler, eller trenger å raskt validere ideer og bygge MVP, så er effektiviteten og påliteligheten til Claude Code langt bedre. Tid er penger, når Codex stiller deg det tiende spørsmålet, kan Claude Code allerede være i gang.

Men hvis du jobber med bedriftsbackend, med strenge krav til sikkerhet, er Codex verdt å vurdere. Forutsetningen er at du må ha tålmodighet.

Referansemateriale

  • YouTube-video: Claude Code vs Codex Head-to-Head av Mansel Scheffel (lenke)
  • Testfiler: Google Drive - Alle koder og konfigurasjonsfiler (lenke)
Published in Technology

You Might Also Like