智谱GLM-5这次开源,让高级程序员也危险了...
真的,2026年的AI比25年疯太多了。
最近我这个一天16个小时泡在AI里面的人,都有点追不上AI进化的速度。感觉每天一睁眼,世界就变了个样。
这不,昨天深夜,智谱又放了个大招,直接开源了他们目前最强的旗舰模型:GLM-5。
在全球权威的Artificial Analysis榜单里面,GLM-5超越Gemini干到了全球第四、开源第一!

还真是如我所料啊,记得上次GLM-4.7发布的时候,我就在文章里跟兄弟们预测了一波:盲猜GLM-4.8或者GLM-5将在春节前夕发布,没想到真来了,哈哈😄
而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了,这次直接干到了5.0。
这就说明,不是什么小修小补,是底座能力的大跨越。
先给大家介绍一下,这次GLM-5到底更新了啥:
简单来说,之前的模型,大家普遍都在卷Vibe Coding,就是所谓的一句话生成,看谁生成的网页特效更炫酷,看谁能一句话搓个炫酷的游戏。
但GLM-5这次不跟你卷这个了(终于!),它把大模型的能力从写代码,提升到能构建系统。
什么意思呢?它的重心不再是写漂亮的前端页面,而是进化成了一个能干脏活、累活、做长任务的系统架构师。
强调的是Agentic Engineering,也就是智能体工程能力。
我看了下官方的数据,参数规模从355B干到了744B(激活40),预训练数据从23T提升到了28.5T。
在SWE-bench-Verified这个公认的编程基准测试里,得分77.8,直接把Gemini 3 Pro甩在了身后,和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。

目前在z.ai上面就可以免费使用:

开源地址:
GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5
其实在前几天,X上就突然冒出来一个叫Pony的神秘模型。
当时很多朋友都在猜,这个Pony到底是哪路神仙?众说纷纭
其实代号Pony的模型就是GLM-5,至于为什么叫Pony呢,大概是因为马年快到了吧🤔。
我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下,说实话,真滴很强(在X上热度也是非常高)。
只花了7分钟,一次性生成了一个API中转站!
虽然还是MVP Demo,但是页面功能已经很齐全了,而且包含后端逻辑,以及数据库,数据是动态的,麻雀虽小五脏俱全。
在深度体验后,我发现GLM-5在制定计划的时候,那种味道,太像Claude Opus了。
熟悉Claude Opus的朋友都知道,在干活之前,可以用它会给你列一个非常详细、逻辑严密的计划。
GLM-5现在也有了这个能力。
比如,我有一个一直想做,但是因为懒一直没动手的事儿。
我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。
平时写文章或者查资料的时候,有些问题我经常会想听听多个AI的意见,综合对比一下。 ฉันจะต้องเปิดหน้าต่างเบราว์เซอร์หลายหน้า คัดลอกและสลับไปมาระหว่างหน้าต่างต่างๆ เพื่อวางและส่งหลายครั้ง จากนั้นสลับหน้าต่างเพื่อดูผลลัพธ์
แม้ว่ามันจะไม่ใช่เรื่องใหญ่โตอะไร แต่การทำซ้ำๆ หลายครั้งมันน่าเบื่อมาก
ฉันเลยคิดว่า จะเป็นไปได้ไหมที่จะสร้างปลั๊กอินเบราว์เซอร์ที่สามารถส่งคำถามเดียวกันไปยังหน้าเว็บของ AI ทั้งสี่ตัวพร้อมกันในหน้าต่างเดียว และรับคำตอบทั้งหมดในปลั๊กอิน?
แต่สิ่งนี้ค่อนข้างยุ่งยาก เพราะโครงสร้างของเว็บไซต์ AI แต่ละแห่งไม่เหมือนกัน และยังมีกลไกการป้องกันต่างๆ ที่ต้องวิเคราะห์โครงสร้าง DOM ของพวกมัน
ดังนั้น ฉันจึงมอบหมายงานที่ซับซ้อนนี้ให้กับ GLM-5
เปิด Claude Code ในโหมด Plan เพื่อให้มันวางแผนก่อน
จากนั้นมันจะโต้ตอบกับฉันและถามความคิดเห็นของฉัน:
แผนที่ได้ในที่สุดนั้นละเอียดมาก ยาวถึง 633 บรรทัด..
จากนั้นก็เริ่มดำเนินการตามแผนอย่างขยันขันแข็ง ไม่คิดว่าขั้นตอนแรกในการเริ่มต้นโครงการจะใช้เวลาไป 50 กว่านาที..
ในระหว่างกระบวนการนี้ มันจะเรียกใช้เครื่องมือ Playwright MCP โดยอัตโนมัติ เปิดเบราว์เซอร์ และเข้าถึงเว็บไซต์ AI เหล่านั้น
มันเหมือนกับโปรแกรมเมอร์จริงๆ ที่ตรวจสอบองค์ประกอบ วิเคราะห์ว่าช่องป้อนข้อมูลอยู่ที่ไหน Class ของปุ่มส่งคืออะไร วิธีรับสตรีมข้อความที่ส่งคืน... กระบวนการทั้งหมดเป็นไปโดยอัตโนมัติ ฉันไม่ได้เขียนโค้ดแม้แต่บรรทัดเดียว
PS: ลืมบันทึกหน้าจอ เพราะฉันกำลังรันงานอื่นในหน้าต่างอื่นพร้อมกัน
การรอคอยนั้นคุ้มค่า ปลั๊กอินที่ฉันต้องการ ซึ่งสามารถถามคำถามครั้งเดียวและให้ AI ทั้งหมดตอบพร้อมกัน ก็เสร็จสมบูรณ์แล้ว
นี่คือสิ่งที่ฉันต้องการอย่างแท้จริง~
นอกจากนี้ ก่อนหน้านี้ฉันไม่ได้สร้างแพลตฟอร์มสร้างวิดีโอการตลาดด้วยดิจิทัลอวตารแบบคลิกเดียวเหรอ?
ต่อมา เพื่อให้ได้ประสบการณ์ที่ดีขึ้น ฉันได้ปรับโครงสร้างส่วนหน้าใหม่ การปรับโครงสร้างนี้ทำให้ทั้งโครงการยุ่งเหยิงไปหมด: อินเทอร์เฟซส่วนหน้าและส่วนหลังไม่ตรงกัน ตรรกะเก่าบางอย่างในส่วนหลังไม่สามารถทำงานได้กับส่วนหน้าใหม่ มีข้อผิดพลาดมากมาย ทำให้การแก้ไขเป็นเรื่องยาก
ครั้งนี้ ฉันเปิดโหมด plan ใน Claude Code จากนั้นมอบหมายงานค้นหาและแก้ไขข้อผิดพลาดในกระบวนการหลักให้กับ GLM-5 โดยตรง
เริ่มจากแผนรายละเอียด:
หลังจากยืนยันว่าแผนถูกต้องแล้ว ฉันก็ปล่อยให้มันเริ่มดำเนินการอย่างขยันขันแข็ง (ในระหว่างกระบวนการนี้ มีการใช้ browser mcp เพื่อควบคุม)
ความเร็วในการดำเนินการของมันไม่เร็ว
แต่ไม่ใช่เพราะโมเดลช้า หลายครั้งที่ฉันเห็นความเร็วในการใช้ Token พุ่งขึ้นไปถึงพันต่อวินาทีอย่างเห็นได้ชัด
แต่เนื่องจากงานซับซ้อนเกินไป มันจึงต้องไตร่ตรองตัวเอง เรียกใช้เครื่องมือ และรันการทดสอบอย่างต่อเนื่อง
นอกจากนี้ยังมีเวลาที่ใช้ไปกับการดาวน์โหลด dependencies หรือการรันคำสั่ง
งานแก้ไขนี้ใช้เวลาไป 40 กว่านาที
บางคนอาจจะบอกว่า 40 นาที? ฉันเขียนเสร็จไปแล้ว
emmm แต่ใน 40 นาทีนี้ ฉันเปิดบันทึกหน้าจอ ดูวิดีโอ หรือแม้แต่ไปเดินเล่นกับสุนัข
ในขณะที่มันกำลังทำงานให้ฉันอย่างตั้งใจ และเป็นงานที่น่าปวดหัวที่สุด เช่น การค้นหาข้อผิดพลาดและการปรับโครงสร้าง
อย่ามองว่ามันดำเนินการช้า แต่ผลลัพธ์ที่ได้นั้นโดดเด่นมาก
เมื่อฉันรันมัน ปัญหาต่างๆ ก็ได้รับการแก้ไขโดยพื้นฐานแล้ว
โปรดดู VCR:
นอกจากนี้ยังมีผลลัพธ์บางอย่างที่ฉันพบข้อผิดพลาดเล็กน้อยในระหว่างการทดสอบในภายหลัง จากนั้นให้มันแก้ไขและปรับปรุง
แต่ในส่วนของการแก้ไขข้อผิดพลาดและการปรับปรุงฟังก์ชัน ฉันมั่นใจที่จะมอบหมายให้มัน
เมื่อก่อนตอนใช้ AI อื่นๆ แก้ไขข้อผิดพลาด มักจะกังวลว่าข้อผิดพลาดจะยิ่งมากขึ้น โครงการจะยิ่งยุ่งเหยิง เหมือนกับการเอาไม้ซีกไปงัดไม้ซุง..
ก่อนหน้านี้ เพื่อหลีกเลี่ยงปัญหานี้ ต้องใช้วิธีการทางวิศวกรรมต่างๆ เพื่อจำกัด AI
เช่น เน้นขอบเขตของการแก้ไขแต่ละครั้ง หรือเขียนสิ่งเหล่านี้ลงในกฎ หรือแก้ไขข้อผิดพลาดเพียงครั้งละหนึ่งข้อ และทดสอบฟังก์ชันอื่นๆ หลังจากแก้ไขแต่ละครั้ง... มันยุ่งยากมาก
แต่การใช้ GLM-5 แก้ไขข้อผิดพลาด ประสบการณ์เปลี่ยนไปอย่างสิ้นเชิง
ฉันเพียงแค่ต้องอธิบายสถานการณ์ปัจจุบัน ส่งบันทึกข้อผิดพลาดให้มัน และบอกว่าฉันต้องการผลลัพธ์แบบไหน
มันแทบจะแก้ไขได้สำเร็จในครั้งเดียว และจะไม่ส่งผลกระทบต่อฟังก์ชันอื่นๆ เลย
ยิ่งไปกว่านั้น ในการสนทนาครั้งเดียว ฉันโยนข้อผิดพลาดที่แตกต่างกันสี่ข้อที่พบในกระบวนการทั้งหมดให้มัน มันก็สามารถแก้ไขทีละข้อได้อย่างชัดเจน
ความรู้สึกมั่นคงแบบนี้มันสบายมาก
ตอนนี้ฉันสามารถมอบหมายให้ GLM-5 ทำงานพัฒนาที่ซับซ้อนใดๆ ให้ฉันได้อย่างมั่นใจ โดยพื้นฐานแล้วจะไม่มีข้อผิดพลาด
แม้ว่าจะมีปัญหาบ้าง ก็แค่รันคำสั่ง rollback ใน Claude Code แล้วย้อนกลับไปเริ่มต้นใหม่
หลังจากที่ใช้ GLM-5 ปรับปรุงทั้งโครงการแล้ว กระบวนการทั้งหมดก็เสร็จสมบูรณ์โดยพื้นฐาน**"สุดท้าย"**
หลังจากได้ลอง GLM-5 สิ่งที่ผมรู้สึกมากที่สุดคือ: AI ของจีนลุกขึ้นยืนได้แล้วจริงๆ
เมื่อสองวันก่อน Seedance 2.0 ของ ByteDance ได้เปิดตัว ซึ่งพิสูจน์ให้เห็นว่าโมเดลที่ผลิตในประเทศจีนได้ก้าวขึ้นสู่ระดับโลกในด้านการสร้างวิดีโอ โดยเหนือกว่า Sora2 และ Veo3.1 โดยตรง
และการเปิดตัว GLM-5 ของ Zhipu ในครั้งนี้ ก็ได้ส่งมอบคำตอบที่เกินความคาดหมายในด้าน AI Coding ซึ่งเป็นสนามแข่งที่แข็งแกร่งอีกแห่งหนึ่ง
เมื่อก่อนเรามักจะพูดว่า โมเดลที่ผลิตในประเทศจีนยังมีช่องว่างกับ GPT, Claude Opus และ Gemini ในด้านการให้เหตุผลเชิงตรรกะและการเขียนโค้ด
แต่วันนี้ GLM-5 ได้บอกเราด้วยผลงานที่เป็นรูปธรรมว่า ช่องว่างนี้กำลังถูกลบออกไป
GLM-5 ไม่ใช่แค่ของเล่นที่ใช้ทำ Demo ได้เท่านั้น แต่เป็นเครื่องมือเพิ่มประสิทธิภาพการทำงานที่ช่วยคุณทำงาน สร้างระบบ แก้ปัญหาที่ซับซ้อนและงานที่ต้องใช้เวลานานได้จริงๆ
ที่สำคัญที่สุดคือ มันเป็นโอเพนซอร์ส
ซึ่งหมายความว่า นักพัฒนาทุกคน ทุกองค์กร สามารถมีสถาปนิก AI ระดับแนวหน้าได้ในราคาที่ถูกลง
และปัจจุบัน Coding Plan ของ GLM ก็ขายดีจนระเบิด ทางการได้ออกประกาศว่ากำลังขยายกำลังการผลิตอย่างเร่งด่วน และที่สำคัญคือ ครั้งนี้ได้เชื่อมต่อกับคลัสเตอร์หมื่นการ์ดของชิปที่ผลิตในประเทศจีน
อย่างไรก็ตาม เนื่องจากการลงทุนด้านกำลังประมวลผลที่เพิ่มขึ้น ราคาจึงสูงขึ้นเล็กน้อย โชคดีที่ผมได้แพ็กเกจ Max มาก่อนหน้านี้
จากตรงนี้จะเห็นได้ว่า ตั้งแต่ชิปไปจนถึงโมเดล ตั้งแต่กำลังประมวลผลระดับล่างไปจนถึงแอปพลิเคชันระดับบน เรากำลังสร้างชุดเทคโนโลยี AI ระดับโลกที่เป็นของเราเองอย่างสมบูรณ์
ปี 2026 ถูกกำหนดให้เป็นปีที่แอปพลิเคชัน AI จะระเบิด และเป็นปีที่บ้าคลั่งยิ่งกว่าเดิม
หากคุณต้องการสัมผัสความรู้สึกของการมีสถาปนิก AI ระดับแนวหน้า ลองไปลอง GLM-5 ดูสิข้อแม้คือคุณต้องแย่งแพ็กเกจ Max ให้ได้ก่อนนะ ฮ่าๆ





