Claude Code vs Codex: He mirat 38 minuts de proves, la diferència és més gran del que pensava

Primer de tot, la conclusió: si ets un desenvolupador independent, o necessites convertir ràpidament una idea en un producte, escull Claude Code. No hi ha res a discutir.

Normalment faig servir Claude Code, Codex només l'obro de tant en tant per provar-lo. Aquesta preferència no és per moda, Claude Code actualitza massa ràpid, el fundador Boris Churney sovint comparteix a Twitter les experiències de l'equip utilitzant-lo per a desenvolupaments reals. No és un demo, és realment el que s'executa en un entorn de producció.

I Codex? La seva capacitat és realment potent, he treballat en alguns petits programes. Hi ha qui diu que per fer backend o seguretat, Codex és més adequat.

El fundador de Clawdbot, Peter Steinberger, afirma que va dedicar aproximadament 10 dies a fer codificació d'ambient per crear el prototip de Clawdbot, depenent principalment de Claude Code i Codex per al desenvolupament, on per a la codificació complexa i les parts centrals es va confiar més en Codex.

Aleshores, quina de les dues és més adequada com a eina de programació AI? Abans no estava segur.

Fins que vaig veure aquesta prova.

El blogger estranger Mansel Scheffel va fer un experiment molt dur: va donar a les dues eines el mateix prompt, per fer-les construir una aplicació des de zero i desplegar-la. Va enregistrar tot el procés, 38 minuts.

I. Configuració de l'experiment: un duel completament just

La tasca és molt senzilla però també molt completa: construir una aplicació d'anàlisi d'intel·ligència competitiva anomenada "Rival".

L'usuari introdueix l'URL de l'empresa, l'aplicació captura automàticament la informació d'aquesta empresa i dels seus competidors, generant un informe d'anàlisi competitiva complet. Si busques fer aquesta anàlisi a través d'una consultora, et costarà com a mínim 10.000 dòlars.

Tecnologia: Supabase (base de dades + autenticació) + Firecrawl (captura web) + Vercel (desplegament)

Regles: prompts completament idèntics, sense suggeriments addicionals, veure qui pot completar-ho de manera independent.

II. Primera ronda: fase de planificació

Codex comença preguntant-te una desena de preguntes.

Qui és l'usuari objectiu?
Quin model utilitzaràs per a l'anàlisi?
Quina opció d'autenticació escolliràs?
Com definiràs l'estil de la UI?
Quin serà el límit d'ús per defecte?

I Claude Code? No va fer cap pregunta.

Va començar a escriure codi directament.

L'opinió del blogger és molt encertada: "Codex és com un aprenent prudent, Claude Code és com un veterà segur de si mateix."

III. Segona ronda: velocitat de construcció

Després ve l'espera llarga.

Claude Code: aproximadament 1 hora per completar-ho
Codex: més de 2 hores, encara continua

He anotat les paraules del blogger: "Ja fa 2 hores i 34 minuts que estic aquí, la major part del temps esperant Codex."

IV. Tercera ronda: comparació de la qualitat de la UI

Després que ambdues parts estiguin desplegades, el blogger obre la interfície per comparar.

La interfície de Claude Code: no és espectacular, però és funcional. La disposició és raonable, la tipografia és normal.

La interfície de Codex: el blogger es queixa immediatament—

"Parlant seriosament, aquesta interfície és massa lletja. Som al 2026, com pot generar aquesta tipografia i espaiat?"

V. Quarta ronda: proves de funcionalitat

Arriba la veritable prova: fer que ambdues parts analitzin ClickUp.

Claude Code:

La primera vegada va fallar. Però la solució va ser ràpida, en pocs minuts va localitzar el problema (configuració de validació JWT), i en 4 minuts ho va arreglar.

Després de reparar-ho, va aconseguir capturar ClickUp i els seus competidors: Monday, Notion, Asana, Atlassian. També es va generar l'informe.

Codex:

Va trobar el mateix error.

Va trigar 19 minuts a trobar el problema.

Després de reparar-ho, encara no funcionava. El blogger va esperar molt més temps, i finalment va abandonar.

VI. Cinquena ronda: avaluació per tercers

El blogger va demanar a Gemini Pro 3 que fes una avaluació cega de les dues biblioteques de codi. Aquesta fase és força interessant.

En termes de seguretat del backend: Codex va guanyar.

Gemini considera que la seva arquitectura de seguretat és més madura: polítiques de seguretat a nivell de fila (RLS) completes, registres d'auditoria immutables, i modes d'autorització millor implementats. Això també corrobora l'opinió del sector: per fer backend i seguretat, Codex realment té un bon sistema.

En termes de qualitat del frontend: Claude Code va guanyar clarament.

La integritat del codi, la claredat lògica, i la qualitat de la implementació de la UI, són clarament millors.

El resum del blogger és molt directe:

"Pots convèncer-me que Codex és més segur, però no em pots convèncer d'utilitzar-lo. Perquè la seva experiència d'usuari és massa dolenta. Una eina que no pot ni tan sols implementar funcions bàsiques, quina utilitat té, per molt segura que sigui?"

VII. Resum de les diferències clau

Després de veure aquesta prova, la meva opinió ha canviat una mica.

Abans pensava que ambdues eines tenien els seus pros i contres, i que la selecció depenia del context. Ara crec que, si ets un desenvolupador independent, o necessites validar ràpidament una idea o construir un MVP, l'eficiència i fiabilitat de Claude Code són superiors. El temps és diners, quan Codex et fa la desena pregunta, Claude Code ja pot estar funcionant.

Però si estàs treballant en un backend d'empresa amb estrictes requisits de seguretat, Codex val la pena considerar. Sempre que tinguis paciència.

Fonts de referència

Vídeo de YouTube: Claude Code vs Codex Head-to-Head per Mansel Scheffel (enllaç)
Fitxers de prova: Google Drive - Tots els codis i fitxers de configuració (enllaç)

Claude Code vs Codex: He mirat 38 minuts de proves, la diferència és més gran del que pensava

Claude Code vs Codex: He mirat 38 minuts de proves, la diferència és més gran del que pensava

I. Configuració de l'experiment: un duel completament just

II. Primera ronda: fase de planificació

III. Segona ronda: velocitat de construcció

IV. Tercera ronda: comparació de la qualitat de la UI

V. Quarta ronda: proves de funcionalitat

VI. Cinquena ronda: avaluació per tercers

VII. Resum de les diferències clau

Fonts de referència

You Might Also Like

Guia de modificació de Claude Code Buddy: com obtenir mascotes de llegenda brillants

Obsidian llança Defuddle, portant Obsidian Web Clipper a un nou nivell

OpenAI de sobte anuncia "tres en un": fusió de navegador + programació + ChatGPT, reconeixent que han comès errors durant l'últim any

2026, no et forcis a ser 'autònom'! Fes aquestes 8 petites coses, la salut vindrà de manera natural

Aquells pares que es dediquen a perdre pes i no ho aconsegueixen, segurament fallen aquí

Guia per a l'execució estable de l'AI Browser durant 24 hores