Claude Code vs Codex：ฉันดูการทดสอบจริง 38 นาที ความแตกต่างมากกว่าที่คิด

先说结论：如果你是独立开发者，或者需要快速把想法变成产品，选 Claude Code。没什么好纠结的。

我平时主要用 Claude Code，Codex 只是偶尔打开试试。这个偏好不是跟风，Claude Code 更新太快了，创始人 Boris Churney 经常在推特分享团队用它做真实开发的经验。不是 demo，是真正跑在生产环境的东西。

Codex 呢？能力确实强，我上手做过几个小程序。圈子里有人说做后端、搞安全用 Codex 更合适。

Clawdbot创始人Peter Steinberger表示，他用大约10天时间vibe coding做出了Clawdbot的原型，主要依赖Claude Code和Codex进行开发，其中复杂编码和核心部分他更依赖Codex。

所以这两者到底谁更适合作为AI编程工具？我之前也不确定。

直到看到这个实测。

国外博主 Mansel Scheffel 做了个很硬核的实验：给两个工具完全相同的 prompt，让它们从零构建一个应用，部署上线。全程录了下来，38 分钟。

一、实验设定：完全公平的对决

任务很简单不过也很完整：构建一个叫"Rival"的竞品情报分析应用

用户输入公司 URL，应用自动抓取该公司及其竞争对手的信息，生成完整的竞争分析报告。这种分析如果找咨询公司做，少说得花 1 万美元。

技术栈：Supabase（数据库+认证）+ Firecrawl（网页抓取）+ Vercel（部署）

规则：完全相同的提示词，不给额外提示，看谁能独立完成

二、第一轮：规划阶段

Codex 一上来就问你十几个问题。

谁是目标用户？
用什么模型做分析？
认证方式选哪个？
UI 风格怎么定？
默认用量上限设多少？

Claude Code 呢？一个问题都没问。

直接开始写代码。

博主的评价很到位："Codex 像个谨慎的实习生，Claude Code 像个自信的老手。"

三、第二轮：构建速度

然后就是漫长的等待。

Claude Code：大概 1 小时搞定
Codex：超过 2 小时，还在继续

博主的原话我记下来了："我已经坐在这里 2 小时 34 分钟了，大部分时间都在等 Codex。"

四、第三轮：UI 质量对比

两边都部署完后，博主打开界面对比。

Claude Code 的界面：不算惊艳，但能用。布局合理，字体正常。

Codex 的界面：博主当场吐槽——

"说真的，这个界面太丑了。2026 年了，怎么能生成出这种字体和间距？"

五、第四轮：功能测试

真正的考验来了：让两边都分析 ClickUp。

Claude Code：

第一次跑报错了。但修复很快，几分钟定位问题（JWT 验证配置），4 分钟内修好。

修完之后成功抓取了 ClickUp 和它的竞争对手：Monday、Notion、Asana、Atlassian。报告也生成了。

Codex：

遇到同样的错误。

花了 19 分钟才找到问题。

修完之后还是不行。博主又等了很久，最后放弃了。

六、第五轮：第三方评审

博主请了 Gemini Pro 3 盲评两个代码库。这个环节挺有意思。

前端质量方面：Claude Code 完胜

代码完整性、逻辑清晰度、UI 实现质量，都明显更好。

博主的总结很直接：

"你可以说服我 Codex 更安全，但你无法说服我去用它。因为它的用户体验太差了。一个连基本功能都无法实现的工具，再安全又有什么意义？"

七、核心差距总结

看完这个实测，我的想法有些变化。

之前我觉得两个工具各有优劣，选哪个看场景。现在我觉得，如果你是独立开发者，或者需要快速验证想法、搭 MVP，Claude Code 的效率和可靠性都更胜一筹。时间就是钱，等 Codex 问你第十个问题的时候，Claude Code 可能已经跑起来了。

但如果你做的是企业级后端，对安全有严格要求，Codex 值得考虑。前提是你得有耐心。

参考资料

YouTube 视频：Claude Code vs Codex Head-to-Head by Mansel Scheffel（链接）
测试文件：Google Drive - 所有代码和配置文件（链接）

Claude Code vs Codex：ฉันดูการทดสอบจริง 38 นาที ความแตกต่างมากกว่าที่คิด

Claude Code vs Codex：ฉันดูการทดสอบจริง 38 นาที ความแตกต่างมากกว่าที่คิด

一、实验设定：完全公平的对决

二、第一轮：规划阶段

三、第二轮：构建速度

四、第三轮：UI 质量对比

五、第四轮：功能测试

六、第五轮：第三方评审

七、核心差距总结

参考资料

You Might Also Like

Claude Code Buddy แก้ไขคู่มือ: วิธีการรับสัตว์เลี้ยงระดับตำนานที่เปล่งประกาย

Obsidian เปิดตัว Defuddle ยกระดับ Obsidian Web Clipper สู่ระดับใหม่

OpenAI突然宣布"三合一"：浏览器+编程+ChatGPT合并，内部承认过去一年走错了

2026，不再逼自己"自律"！做好这8件小事，健康自然来

แม่ๆ ที่พยายามลดน้ำหนักแต่ไม่สำเร็จ แน่นอนว่าต้องเจอปัญหานี้

AI Browser 24 ชั่วโมงการทำงานที่เสถียร

Claude Code vs Codex：ฉันดูการทดสอบจริง 38 นาที ความแตกต่างมากกว่าที่คิด

一、 实验设定：完全公平的对决

二、 第一轮：规划阶段

三、 第二轮：构建速度

四、 第三轮：UI 质量对比

五、 第四轮：功能测试

六、第五轮：第三方评审

七、 核心差距总结

参考资料

You Might Also Like

Claude Code Buddy แก้ไขคู่มือ: วิธีการรับสัตว์เลี้ยงระดับตำนานที่เปล่งประกาย

Obsidian เปิดตัว Defuddle ยกระดับ Obsidian Web Clipper สู่ระดับใหม่

OpenAI突然宣布"三合一"：浏览器+编程+ChatGPT合并，内部承认过去一年走错了

2026，不再逼自己"自律"！做好这8件小事，健康自然来

แม่ๆ ที่พยายามลดน้ำหนักแต่ไม่สำเร็จ แน่นอนว่าต้องเจอปัญหานี้

AI Browser 24 ชั่วโมงการทำงานที่เสถียร

一、实验设定：完全公平的对决

二、第一轮：规划阶段

三、第二轮：构建速度

四、第三轮：UI 质量对比

五、第四轮：功能测试

七、核心差距总结