智谱GLM-5这次开源,让高级程序员也危险了...
真的,2026年的AI比25年疯太多了。
最近我这个一天16个小时泡在AI里面的人,都有点追不上AI进化的速度。感觉每天一睁眼,世界就变了个样。
这不,昨天深夜,智谱又放了个大招,直接开源了他们目前最强的旗舰模型:GLM-5。
在全球权威的Artificial Analysis榜单里面,GLM-5超越Gemini干到了全球第四、开源第一!

还真是如我所料啊,记得上次GLM-4.7发布的时候,我就在文章里跟兄弟们预测了一波:盲猜GLM-4.8或者GLM-5将在春节前夕发布,没想到真来了,哈哈😄
而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了,这次直接干到了5.0。
这就说明,不是什么小修小补,是底座能力的大跨越。
先给大家介绍一下,这次GLM-5到底更新了啥:
简单来说,之前的模型,大家普遍都在卷Vibe Coding,就是所谓的一句话生成,看谁生成的网页特效更炫酷,看谁能一句话搓个炫酷的游戏。
但GLM-5这次不跟你卷这个了(终于!),它把大模型的能力从写代码,提升到能构建系统。
什么意思呢?它的重心不再是写漂亮的前端页面,而是进化成了一个能干脏活、累活、做长任务的系统架构师。
强调的是Agentic Engineering,也就是智能体工程能力。
我看了下官方的数据,参数规模从355B干到了744B(激活40),预训练数据从23T提升到了28.5T。
在SWE-bench-Verified这个公认的编程基准测试里,得分77.8,直接把Gemini 3 Pro甩在了身后,和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。

目前在z.ai上面就可以免费使用:

开源地址:
GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5
其实在前几天,X上就突然冒出来一个叫Pony的神秘模型。
当时很多朋友都在猜,这个Pony到底是哪路神仙?众说纷纭
其实代号Pony的模型就是GLM-5,至于为什么叫Pony呢,大概是因为马年快到了吧🤔。
我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下,说实话,真滴很强(在X上热度也是非常高)。
只花了7分钟,一次性生成了一个API中转站!
虽然还是MVP Demo,但是页面功能已经很齐全了,而且包含后端逻辑,以及数据库,数据是动态的,麻雀虽小五脏俱全。
在深度体验后,我发现GLM-5在制定计划的时候,那种味道,太像Claude Opus了。
熟悉Claude Opus的朋友都知道,在干活之前,可以用它会给你列一个非常详细、逻辑严密的计划。
GLM-5现在也有了这个能力。
比如,我有一个一直想做,但是因为懒一直没动手的事儿。
我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。
平时写文章或者查资料的时候,有些问题我经常会想听听多个AI的意见,综合对比一下。 Basi itabidi nifungue madirisha mengi ya kivinjari, ninakili, nabandua, natuma mara nyingi kati ya madirisha tofauti, kisha nabadilisha madirisha kwa zamu ili kuangalia matokeo.
Ingawa si jambo kubwa sana, inakera sana ninapofanya hivyo mara nyingi.
Nilikuwa nikifikiria, inawezekana kutengeneza programu jalizi ya kivinjari ambayo inaweza kutuma swali lile lile kwa tovuti za AI hizi nne kwa wakati mmoja ndani ya dirisha moja, na kisha kupokea majibu kwa umoja ndani ya programu jalizi?
Lakini kitu hiki ni cha shida sana, kwa sababu muundo wa kila tovuti ya AI ni tofauti, na kuna aina anuwai za mifumo ya ulinzi, ambayo inahitaji kuchambua miundo yao ya DOM.
Kwa hivyo, niliikabidhi kazi hii ngumu kwa GLM-5.
Anzisha Njia ya Mpango ya Claude Code kwanza ili iweze kufanya mpango
Kisha itaingiliana nami na kuuliza maoni yangu:
Mpango wa mwisho uliopatikana ulikuwa wa kina sana, mrefu sana, na mistari 633..
Kisha ikaanza kutekeleza kulingana na mpango, sikutarajia hatua ya kwanza ya kuanzisha mradi kuchukua zaidi ya dakika 50..
Katika mchakato huu, ilitoa zana ya Playwright MCP kiotomatiki, ilifungua kivinjari yenyewe, na kutembelea tovuti za AI hizo.
Ni kama programu halisi, kwenda kukagua vitu, kuchambua mahali ambapo kisanduku cha kuingiza kipo, darasa la kitufe cha kutuma ni nini, jinsi ya kupata mtiririko wa maandishi uliorejeshwa... mchakato mzima ni otomatiki kabisa, sikuandika mstari wa msimbo.
PS: Nilisahau kurekodi skrini, kwa sababu nilikuwa nikiendesha kazi nyingine katika dirisha lingine kwa wakati mmoja
Kusubiri kulistahili, programu jalizi ambayo nilitaka ya kuuliza swali moja na AI zote kwenye mtandao kujibu kwa wakati mmoja, ilitoka ikiwa bado ni moto.
Hii ndio hasa niliyohitaji~
Pia, hapo awali sikufanya jukwaa la kizazi cha video cha uuzaji wa mtu wa dijiti kwa kubofya mara moja?
Baadaye, ili kufuata uzoefu bora, niliunda upya sehemu ya mbele, ujenzi huu haujalishi, mradi mzima unaweza kusemwa kuwa fujo: miingiliano ya mbele na ya nyuma hailingani, mantiki zingine za zamani za nyuma haziwezi kufanya kazi mbele ya mbele mpya, kuna mende nyingi, na ni shida sana kuifanya.
Safari hii, niliwasha hali ya mpango wa Claude Code, na kisha nikakabidhi moja kwa moja kazi ya kupata mende na kurekebisha mende kwa GLM-5
Kwanza toka mpango wa kina:
Baada ya kuthibitisha kuwa mpango huo ni sahihi, niliiacha ianze kutekeleza (mchakato ulitumia kivinjari mcp kudhibiti).
Kasi yake ya utekelezaji si ya haraka.
Lakini si kwa sababu mfumo ni polepole, mara nyingi, naona kasi ya matumizi ya Token, inaweza kuonekana kwa jicho la uchi kwamba inakwenda hadi maelfu kwa sekunde.
Lakini kwa sababu kazi ni ngumu sana, inahitaji kujitafakari kila wakati, kupiga simu zana, na kuendesha vipimo.
Baadhi ya wakati pia hutumiwa kupakua utegemezi, au kutekeleza amri.
Kazi hii ya ukarabati pia ilichukua zaidi ya dakika 40.
Watu wengine wanaweza kusema, dakika 40? Ningekuwa nimeandika.
emmm, lakini katika dakika hizi 40, niliwasha rekodi ya skrini, nilitazama video, na hata nikamtembeza mbwa.
Na ilikuwa ikifanya kazi kwa bidii kunisaidia, na ilikuwa ikifanya aina ya kazi ya kupata mende na ujenzi ambayo inafanya watu kuwa na maumivu ya kichwa.
Usifikirie kwamba inafanya kazi polepole, lakini athari ya mwisho ni muhimu sana.
Niliendesha, mambo mazuri, shida kimsingi zote zimeshughulikiwa.
Tafadhali tazama VCR:
Baadhi ya athari hapa pia niligundua mende ndogo nilipokuwa nikijaribu baadaye, na kisha nikaiacha irekebishe na kuboresha.
Lakini katika suala la kurekebisha mende na kuboresha kazi, nimeiacha kwa kweli.
Hapo awali, nilikuwa na wasiwasi kwamba mende zitazidi kurekebishwa na mradi utazidi kuwa fujo, mfano wa kubomoa ukuta wa mashariki ili kufidia ukuta wa magharibi..
Ili kuepuka shida hii hapo awali, ilibidi nitumie njia anuwai za uhandisi kuzuia AI.
Kwa mfano, kila wakati ninarekebisha, ninasisitiza wigo, au kuandika hizi kwenye sheria, au kurekebisha mende moja tu kila wakati, na kila wakati ninarekebisha, lazima nijaribu kazi zingine... kwa hivyo ni shida sana.
Lakini kutumia GLM-5 kurekebisha mende, uzoefu umebadilika kabisa.
Mimi hu hitaji tu kuelezea hali, kuacha kumbukumbu za makosa kwake, na kumwambia athari ninayotarajia ni nini.
Inaweza karibu kurekebisha kwa mafanikio mara moja, na haitaathiri kazi zingine kabisa.
Hata, katika mazungumzo moja, nilitupa mende nne tofauti zilizopatikana katika mchakato mzima kwake, na inaweza kuzirekebisha moja kwa moja kwa njia iliyo wazi.
Hisi hii thabiti ni nzuri sana.
Sasa ninaweza kuiacha GLM-5 kwa ujasiri kunisaidia kukamilisha kazi yoyote ngumu ya maendeleo, kimsingi hakutakuwa na makosa.
Hata ikiwa kuna shida mara kwa mara, fanya tu amri ya kurudisha nyuma katika Claude Code, rudi nyuma na uanze tena.
Baada ya mradi mzima kuboreshwa na GLM-5, michakato yote kimsingi imekamilika.Pia niko tayari kufungua mradi huu kwa chanzo huria hivi karibuni (bado ninahitaji kutoa sehemu ya API za modeli mbalimbali na kuigeuza kuwa usanidi).
**\Sharti ufanikiwe kupata kifurushi cha Max, haha.





