Claude Code vs Codex:ഞാൻ 38 മിനിറ്റ് യാഥാർത്ഥ്യ പരിശോധന നടത്തി, വ്യത്യാസം പ്രതീക്ഷിച്ചതിൽ കൂടുതൽ വലിയതാണ്
Claude Code vs Codex:ഞാൻ 38 മിനിറ്റ് യാഥാർത്ഥ്യ പരിശോധന നടത്തി, വ്യത്യാസം പ്രതീക്ഷിച്ചതിൽ കൂടുതൽ大的ത്
ആദ്യമേ നിഗമനം പറയാം: നിങ്ങൾ സ്വതന്ത്ര വികസനക്കാരനാണെങ്കിൽ, അല്ലെങ്കിൽ ആശയങ്ങളെ ഉൽപ്പന്നങ്ങളാക്കി മാറ്റാൻ വേഗത്തിൽ ആവശ്യമാണ് എങ്കിൽ, Claude Code തിരഞ്ഞെടുക്കുക. ഇതിൽ ആശങ്കപ്പെടേണ്ടതില്ല.
ഞാൻ സാധാരണയായി Claude Code ഉപയോഗിക്കുന്നു, Codex വെറും ചിലപ്പോൾ തുറന്ന് നോക്കുന്നു. ഈ ഇഷ്ടം ഫാഷൻ പിന്തുടരുന്നതല്ല, Claude Code വളരെ വേഗത്തിൽ അപ്ഡേറ്റ് ചെയ്യുന്നു, സ്ഥാപകൻ Boris Churney പതിവായി ട്വിറ്ററിൽ ടീമിന്റെ യാഥാർത്ഥ്യ വികസന അനുഭവങ്ങൾ പങ്കുവെയ്ക്കുന്നു. ഇത് ഡെമോ അല്ല, ഉൽപ്പന്ന പരിസ്ഥിതിയിൽ യഥാർത്ഥത്തിൽ പ്രവർത്തിക്കുന്നതാണ്.
Codex എങ്ങനെ? കഴിവുകൾ确实强,我上手做过几个小程序。圈子里有人说做后端、搞安全用 Codex 更合适。
Clawdbot创始人Peter Steinberger表示,他用大约10天时间vibe coding做出了Clawdbot的原型,主要依赖Claude Code和Codex进行开发,其中复杂编码和核心部分他更依赖Codex。
所以这两者到底谁更适合作为AI编程工具?我之前也不确定。
直到看到这个实测。
国外博主 Mansel Scheffel 做了个很硬核的实验:给两个工具完全相同的 prompt,让它们从零构建一个应用,部署上线。全程录了下来,38 分钟。
一、 实验设定:完全公平的对决
任务很简单不过也很完整:构建一个叫"Rival"的竞品情报分析应用
用户输入公司 URL,应用自动抓取该公司及其竞争对手的信息,生成完整的竞争分析报告。这种分析如果找咨询公司做,少说得花 1 万美元。
技术栈:Supabase(数据库+认证)+ Firecrawl(网页抓取)+ Vercel(部署)
规则:完全相同的提示词,不给额外提示,看谁能独立完成
二、 第一轮:规划阶段
Codex 一上来就问你十几个问题。
- 谁是目标用户?
- 用什么模型做分析?
- 认证方式选哪个?
- UI 风格怎么定?
- 默认用量上限设多少?
直接开始写代码。
博主的评价很到位:"Codex 像个谨慎的实习生,Claude Code 像个自信的老手。"
三、 第二轮:构建速度
然后就是漫长的等待。
- Claude Code:大概 1 小时搞定
- Codex:超过 2 小时,还在继续
四、 第三轮:UI 质量对比
两边都部署完后,博主打开界面对比。
Claude Code 的界面:不算惊艳,但能用。布局合理,字体正常。
Codex 的界面:博主当场吐槽——
"说真的,这个界面太丑了。2026 年了,怎么能生成出这种字体和间距?"
五、 第四轮:功能测试
真正的考验来了:让两边都分析 ClickUp。
Claude Code:
第一次跑报错了。但修复很快,几分钟定位问题(JWT 验证配置),4 分钟内修好。
修完之后成功抓取了 ClickUp 和它的竞争对手:Monday、Notion、Asana、Atlassian。报告也生成了。
Codex:
遇到同样的错误。
花了 19 分钟才找到问题。
修完之后还是不行。博主又等了很久,最后放弃了。
六、第五轮:第三方评审
博主请了 Gemini Pro 3 盲评两个代码库。这个环节挺有意思。
后端安全方面:Codex 赢了
Gemini 认为它的安全架构更成熟:完整的行级安全策略(RLS)、不可变审计日志、授权模式都做得更好。这也印证了圈子里的看法——做后端、搞安全,Codex 确实有一套。
前端质量方面:Claude Code 完胜
代码完整性、逻辑清晰度、UI 实现质量,都明显更好。
博主的总结很直接:
"你可以说服我 Codex 更安全,但你无法说服我去用它。因为它的用户体验太差了。一个连基本功能都无法实现的工具,再安全又有什么意义?"
七、 核心差距总结
看完这个实测,我的想法有些变化。
之前我觉得两个工具各有优劣,选哪个看场景。现在我觉得,如果你是独立开发者,或者需要快速验证想法、搭 MVP,Claude Code 的效率和可靠性都更胜一筹。时间就是钱,等 Codex 问你第十个问题的时候,Claude Code 可能已经跑起来了。
但如果你做的是企业级后端,对安全有严格要求,Codex 值得考虑。前提是你得有耐心。

