智谱GLM-5这次开源,让高级程序员也危险了...

2/13/2026
5 min read

真的,2026年的AI比25年疯太多了。

最近我这个一天16个小时泡在AI里面的人,都有点追不上AI进化的速度。感觉每天一睁眼,世界就变了个样。

这不,昨天深夜,智谱又放了个大招,直接开源了他们目前最强的旗舰模型:GLM-5

在全球权威的Artificial Analysis榜单里面,GLM-5超越Gemini干到了全球第四、开源第一!

图片

还真是如我所料啊,记得上次GLM-4.7发布的时候,我就在文章里跟兄弟们预测了一波:盲猜GLM-4.8或者GLM-5将在春节前夕发布,没想到真来了,哈哈😄

而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了,这次直接干到了5.0。

这就说明,不是什么小修小补,是底座能力的大跨越。

先给大家介绍一下,这次GLM-5到底更新了啥:

简单来说,之前的模型,大家普遍都在卷Vibe Coding,就是所谓的一句话生成,看谁生成的网页特效更炫酷,看谁能一句话搓个炫酷的游戏。

但GLM-5这次不跟你卷这个了(终于!),它把大模型的能力从写代码,提升到能构建系统。

什么意思呢?它的重心不再是写漂亮的前端页面,而是进化成了一个能干脏活、累活、做长任务的系统架构师。

强调的是Agentic Engineering,也就是智能体工程能力。

我看了下官方的数据,参数规模从355B干到了744B(激活40),预训练数据从23T提升到了28.5T

在SWE-bench-Verified这个公认的编程基准测试里,得分77.8,直接把Gemini 3 Pro甩在了身后,和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。

目前在z.ai上面就可以免费使用:

开源地址:

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5

其实在前几天,X上就突然冒出来一个叫Pony的神秘模型。

当时很多朋友都在猜,这个Pony到底是哪路神仙?众说纷纭

其实代号Pony的模型就是GLM-5,至于为什么叫Pony呢,大概是因为马年快到了吧🤔。

我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下,说实话,真滴很强(在X上热度也是非常高)。

只花了7分钟,一次性生成了一个API中转站!

虽然还是MVP Demo,但是页面功能已经很齐全了,而且包含后端逻辑,以及数据库,数据是动态的,麻雀虽小五脏俱全。

在深度体验后,我发现GLM-5在制定计划的时候,那种味道,太像Claude Opus了。

熟悉Claude Opus的朋友都知道,在干活之前,可以用它会给你列一个非常详细、逻辑严密的计划。

GLM-5现在也有了这个能力。

比如,我有一个一直想做,但是因为懒一直没动手的事儿。

我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。

平时写文章或者查资料的时候,有些问题我经常会想听听多个AI的意见,综合对比一下。 Noh, siis peaksin avama mitu brauseriakent, kopeerima ja vahetama erinevaid aknaid, kleepima ja saatma mitu korda ning seejärel kordamööda aknaid vahetama, et tulemusi vaadata.

Kuigi see pole ka suur asi, on see paljude kordade järel tõesti tüütu.

Mõtlesin, kas saaks teha brauseri pistikprogrammi, mis suudaks ühes aknas samal ajal saata sama küsimuse nende nelja AI veebilehele ja seejärel saada vastused pistikprogrammis ühtselt?

Kuid see asi on üsna tülikas, sest iga AI veebisaidi struktuur on erinev ja on ka mitmesuguseid kaitsemehhanisme, mis nõuavad nende DOM-i struktuuri analüüsimist.

Seetõttu andsin selle keerulise ülesande GLM-5-le.

Lülitage Claude Code'i plaanirežiim sisse, et see kõigepealt plaani koostaks

Siis suhtleb see minuga ja küsib minu arvamust:

Lõplik plaan on väga detailne, tõesti liiga pikk, 633 rida..

Seejärel hakkasin plaani järgi tegutsema ja ma ei oodanud, et projekti esialgne käivitamine võtab üle 50 minuti..

Selle protsessi käigus kutsus see automaatselt esile Playwright MCP tööriista, avas ise brauseri ja külastas neid AI veebisaite.

See on nagu tõeline programmeerija, kes kontrollib elemente, analüüsib, kus on sisestuskast, mis on saatmisnupu klass, kuidas saada tagastatud tekstivoogu... kogu protsess on täisautomaatne ja ma ei kirjutanud ühtegi koodirida.

PS: Unustasin ekraani salvestada, sest ma käitasin samal ajal teises aknas teist ülesannet

Ootamine on seda väärt, pistikprogramm, mida ma tahtsin, mis võimaldab esitada ühe küsimuse ja saada vastuseid kogu AI võrgustikust, on valmis.

See on täpselt see, mida ma vajan~

Lisaks, ma tegin varem digitaalse inimese turundusvideo ühe klõpsuga genereerimise platvormi.

Hiljem, parema kogemuse saamiseks, ma rekonstrueerisin esiosa ja see rekonstrueerimine oli tõsine, kogu projekt oli nagu puder ja kapsad: esi- ja tagaprogrammi liidesed ei sobinud, mõned vanad tagaprogrammi loogikad ei töötanud uue esiosaga, vigu oli väga palju ja seda oli tülikas parandada.

Seekord lülitasin Claude Code'is sisse plaanirežiimi ja andsin otse GLM-5-le ülesande leida ja parandada peamised vead.

Kõigepealt koostage detailne plaan:

Pärast plaani kinnitamist lasin sellel tegutsema hakata (protsessi käigus kasutati brauseri mcp-d juhtimiseks).

Selle täitmise kiirus ei ole kiire.

Kuid see ei ole mudeli aeglus, ma näen sageli, et Tokeni tarbimise kiirus tõuseb silmnähtavalt sekundis tuhandetesse.

Kuid kuna ülesanne on liiga keeruline, peab see pidevalt enesereflekteerima, tööriistu kutsuma ja teste käivitama.

Osa ajast kulub ka sõltuvuste allalaadimisele või käskude täitmisele.

See parandamisülesanne võttis aega ka üle 40 minuti.

Mõned sõbrad võivad öelda, 40 minutit? Ma oleksin selle juba valmis kirjutanud.

Emm, aga nendel 40 minutil vaatasin ma ekraani salvestust, vaatasin videoid ja isegi jalutasin koeraga.

Ja see töötas täie tähelepanuga minu heaks ja tegi kõige peavalu tekitavamat veaotsingu ja rekonstrueerimise tööd.

Ärge arvake, et see täidab aeglaselt, kuid lõplik efekt on väga märkimisväärne.

Kui ma selle käivitasin, siis kõik, probleemid olid põhimõtteliselt lahendatud.

Palun vaadake VCR-i:

Siin on ka mõned efektid, mille ma hiljem ise testides leidsin väikseid vigu ja lasin sellel neid parandada ja optimeerida.

Kuid ma usaldan sellele tõesti vigade parandamise ja funktsioonide optimeerimise.

Kui ma varem kasutasin teisi AI-sid vigade parandamiseks, siis ma kartsin sageli, et vigu parandatakse üha rohkem ja projekt läheb üha segasemaks, tüüpiline on see, et lammutatakse idasein, et läänesina parandada..

Selle probleemi vältimiseks pidin ma AI-d piirama mitmesuguste inseneritehniliste meetoditega.

Näiteks rõhutage iga muudatuse ulatust või kirjutage need reeglitesse või muutke iga kord ainult ühte viga ja pärast iga muudatust peate testima ka muid funktsioone... igatahes on see väga tülikas.

Kuid GLM-5-ga vigade parandamise kogemus on täiesti muutunud.

Ma pean alati ainult kirjeldama praegust olukorda, viskama sellele vealogid ja ütlema, millist efekti ma ootan.

See suudab peaaegu alati ühe korraga edukalt parandada ja see ei mõjuta üldse muid funktsioone.

Isegi ühes vestluses viskasin sellele korraga kõik neli erinevat viga, mis ma kogu protsessi käigus leidsin, ja see suutis need ka selgelt parandada.

See stabiilne tunne on tõesti liiga mugav.

Ma võin nüüd julgelt anda GLM-5-le ülesande täita mis tahes keerulisi arendusülesandeid ja põhimõtteliselt ei tee see vigu.

Isegi kui on aeg-ajalt probleeme, siis tehke Claude Code'is tagasipööramiskäsk ja minge tagasi, et uuesti alustada.

Pärast kogu projekti GLM-5-ga optimeerimist on kõik protsessid põhimõtteliselt lahendatud.Ma plaanin ka selle projekti peagi avatud lähtekoodiga avaldada (vaja on veel erinevad mudeli API-d välja võtta ja konfiguratsiooniks muuta).

„Lõpuks“

Pärast GLM-5 kogemist on minu suurim tunne: Hiina AI on tõesti jalule tõusnud.

Üleeile avaldas ByteDance Seedance 2.0, mis tõestas, et Hiina kodumaine mudel on videote genereerimise valdkonnas jõudnud maailma esimesele tasemele, ületades otseselt Sora2 ja Veo3.1.

Ja seekordne Zhipu GLM-5 avaldamine on teises raskes AI Coding võistluses andnud ootusi ületava vastuse.

Me ütlesime varem alati, et kodumaistel mudelitel on loogilise arutluse ja koodi kirjutamise osas veel erinevusi GPT, Claude Opuse ja Geminiga.

Kuid täna ütleb GLM-5 meile oma tegelike tulemustega: see erinevus on ühtlustumas.

GLM-5 ei ole ka mänguasi, mida saab kasutada ainult demo tegemiseks, see on tootlikkuse tööriist, mis aitab teil tegelikult tööd teha, süsteeme ehitada, pikaajalisi ülesandeid ja keerulisi probleeme lahendada.

Kõige olulisem on see, et see on avatud lähtekoodiga.

See tähendab, et igal arendajal, igal ettevõttel võib olla tipptasemel AI arhitekt madalamate kuludega.

Ja praegu on GLM-i Coding Plan juba läbi müüdud, ametnikud teatasid, et nad laiendavad hädaolukorras ja peamine on see, et seekord on ühendatud kodumaise kiibi kümnete tuhandete kaartide klastrid.

Kuid arvutusvõimsuse suurenenud investeeringute tõttu on hind veidi tõusnud, õnneks sain ma varem Max paketi.

Siit on näha ka, et kiibist mudelini, alumisest arvutusvõimsusest ülemise rakenduseni ehitame täielikult oma maailmatasemel AI tehnoloogiapinu.

Aasta 2026 on määratud olema AI rakenduste plahvatuslik aasta ja ka hullumeelsem aasta.

Kui soovite ka kogeda tipptasemel AI arhitekti omamise tunnet, proovige kiiresti GLM-5.Eeldus on, et sa pead Max paketi kinni püüdma, haha.

Published in Technology

You Might Also Like