智谱GLM-5这次开源,让高级程序员也危险了...

2/13/2026
6 min read
**真的,2026年的AI比25年疯太多了。** 最近我这个一天16个小时泡在AI里面的人,都有点追不上AI进化的速度。感觉每天一睁眼,世界就变了个样。 这不,昨天深夜,智谱又放了个大招,直接**开源**了他们目前**最强**的旗舰模型:**GLM-5**。 在全球权威的Artificial Analysis榜单里面,**GLM-5超越Gemini干到了全球第四、开源第一!** ![图片](/uploads/wechat-1770959913536-oik3pqi.png) 还真是如我所料啊,记得上次GLM-4.7发布的时候,我就在文章里跟兄弟们预测了一波:盲猜GLM-4.8或者GLM-5将在春节前夕发布,没想到真来了,哈哈😄 而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了,这次直接干到了5.0。 这就说明,不是什么小修小补,是底座能力的大跨越。 **先给大家介绍一下,这次GLM-5到底更新了啥:** 简单来说,之前的模型,大家普遍都在卷Vibe Coding,就是所谓的一句话生成,看谁生成的网页特效更炫酷,看谁能一句话搓个炫酷的游戏。 但GLM-5这次不跟你卷这个了(终于!),它把大模型的能力从写代码,提升到能构建系统。 什么意思呢?它的重心不再是写漂亮的前端页面,而是进化成了一个能干脏活、累活、做长任务的系统架构师。 强调的是Agentic Engineering,也就是智能体工程能力。 我看了下官方的数据,参数规模从**355B干到了744B(激活40)**,预训练数据从**23T提升到了28.5T**。 在SWE-bench-Verified这个公认的编程基准测试里,得分77.8,直接把Gemini 3 Pro甩在了身后,**和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。** ![](/uploads/wechat-1770959913632-3di12gf.png) **目前在z.ai上面就可以免费使用:** ![](/uploads/wechat-1770959913681-xl76jd1.png) **开源地址:** GitHub:https://github.com/zai-org/GLM-5 Hugging Face:https://huggingface.co/zai-org/GLM-5 ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5 其实在前几天,**X上就突然冒出来一个叫Pony的神秘模型。** 当时很多朋友都在猜,这个Pony到底是哪路神仙?众说纷纭 其实代号Pony的模型就是GLM-5,至于为什么叫Pony呢,大概是因为马年快到了吧🤔。 我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下,说实话,真滴很强(在X上热度也是非常高)。 **只花了7分钟,一次性生成了一个API中转站!** 虽然还是MVP Demo,但是页面功能已经很齐全了,而且包含后端逻辑,以及数据库,数据是动态的,麻雀虽小五脏俱全。 ![](/uploads/wechat-1770959913845-kkpqw2d.png)在深度体验后,我发现GLM-5在制定计划的时候,那种味道,太像Claude Opus了。 熟悉Claude Opus的朋友都知道,在干活之前,可以用它会给你列一个非常详细、逻辑严密的计划。 GLM-5现在也有了这个能力。 比如,我有一个一直想做,但是因为懒一直没动手的事儿。 我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。 平时写文章或者查资料的时候,有些问题我经常会想听听多个AI的意见,综合对比一下。

Тогава трябва да отворя няколко прозореца на браузъра, да копирам, да превключвам между различни прозорци, да поставям и изпращам многократно, и след това да превключвам последователно между прозорците, за да видя резултатите.

Въпреки че не е голяма работа, наистина е досадно, когато се прави много пъти.

Затова си помислих, дали е възможно да се направи плъгин за браузър, който да може едновременно да изпраща един и същ въпрос към уеб версиите на тези четири AI в един прозорец и след това да получава отговорите в плъгина?

Но това нещо е доста трудно, защото структурата на всеки AI уебсайт е различна и има различни защитни механизми, които трябва да бъдат анализирани в техните DOM структури.

Затова възложих тази сложна задача на GLM-5.

Включете Plan Mode на Claude Code, за да го накарате да направи план първо

След това той ще взаимодейства с мен и ще поиска моето мнение:

Окончателният план е много подробен, наистина е твърде дълъг, има 633 реда.

След това започна да го изпълнява според плана, но не очаквах, че първата стъпка за инициализиране на проекта ще отнеме повече от 50 минути...

В този процес той автоматично извика инструмента Playwright MCP, сам отвори браузъра и посети уебсайтовете на тези AI.

Той е като истински програмист, който проверява елементи, анализира къде е полето за въвеждане, какъв е класът на бутона за изпращане, как да получи върнатия текстов поток... целият процес е автоматичен, аз не написах нито един ред код.

PS: Забравих да запиша екрана, защото едновременно изпълнявах друга задача в други прозорци

![](/uploads/wechat-1770959914158-lxid9zm.jpeg) Очакването си заслужаваше, плъгинът, който исках, който позволява да задам въпрос веднъж и всички AI в мрежата да отговорят едновременно, беше готов.

Това е точно това, от което се нуждаех~

Освен това, аз преди направих платформа за генериране на маркетингови видеоклипове с дигитален човек с едно щракване.

По-късно, за да постигна по-добро изживяване, преструктурирах предната част, и това преструктуриране доведе до пълен хаос в целия проект: интерфейсите между предната и задната част не съвпадаха, някои стари логики на задната част не можеха да работят пред новата предна част, имаше много грешки и беше много трудно да се оправи.

Този път, в Claude Code, включих plan mode и директно възложих задачата за намиране и отстраняване на грешки в основния процес на GLM-5

Първо излезе подробен план:

След като потвърдих, че планът е правилен, го оставих да започне да го изпълнява (в процеса използвах браузър mcp за контрол).

Скоростта му на изпълнение не е бърза.

Но не е, защото моделът е бавен, в много случаи виждам скоростта на консумация на токени, която видимо се покачва до хиляди за секунда.

Но тъй като задачата е твърде сложна, той трябва постоянно да се самоанализира, да извиква инструменти и да изпълнява тестове.

Някои от времето се губи за изтегляне на зависимости или изпълнение на команди.

Тази задача за поправка също отне повече от 40 минути.

Някои приятели може да кажат, 40 минути? Аз щях да съм го написал.

emmm, но през тези 40 минути аз гледах записи на екрана, скролвах видеа и дори изведох кучето на разходка.

А той беше напълно концентриран да ми помага, и то в най-досадната работа по намиране на грешки и преструктуриране.

Не гледайте, че изпълнява бавно, но крайният ефект е много значителен.

Когато го стартирах, проблемите бяха основно решени.

Моля, вижте VCR:

Има и някои ефекти, които открих по-късно, когато тествах малки грешки, и го накарах да ги поправи и оптимизира.

Но в отстраняването на грешки и оптимизирането на функциите, наистина съм спокоен да му го възложа.

Преди, когато използвах други AI за поправяне на грешки, често се притеснявах, че грешките ще станат повече и проектът ще стане по-объркан, типичен случай на запълване на една дупка, като се копае друга..

Преди, за да избегна този проблем, трябваше да използвам различни инженерни методи, за да огранича AI.

Например, всеки път да подчертавам обхвата на промяната, или да го напиша в правилата, или да променям само една грешка всеки път, и след всяка промяна трябваше да тествам други функции... все пак беше много трудно.

Но с GLM-5 промяната на грешки е напълно различно изживяване.

Аз просто трябва да опиша ситуацията, да му дам логовете за грешки и да му кажа какъв ефект очаквам.

Той почти винаги може да го поправи успешно от първия път и изобщо не засяга други функции.

Дори, в един разговор, директно му хвърлих четири различни грешки, открити в целия процес, и той успя да ги поправи една по една по ясен начин.

Това стабилно усещане е наистина много приятно.

Сега мога спокойно да възложа на GLM-5 да ми помогне да завърша всяка сложна задача за разработка, и основно няма да има грешки.

Дори от време на време да има проблеми, просто изпълнете командата за връщане назад в Claude Code и започнете отначало.

След като целият проект беше оптимизиран от GLM-5, всички процеси бяха основно завършени.

**Също така планирам скоро да направя този проект с отворен код (все още трябва да извлека частта с различните API на моделите и да я превърна в конфигурация).** **„Последно“** След като изпробвах GLM-5, най-голямото ми усещане е, че **китайският AI наистина се изправи на крака.** Преди няколко дни беше пуснат Seedance 2.0 на ByteDance, което доказа, че китайските местни модели са достигнали първото ниво в света в областта на генерирането на видео, надминавайки директно Sora2 и Veo3.1. А пускането на智谱GLM-5 този път е в друга хардкор писта, AI Coding, и представи неочаквано добър отговор. Преди винаги казвахме, че местните модели имат пропуски в логическото мислене и писането на код в сравнение с GPT, Claude Opus и Gemini. Но днес GLM-5 ни казва с реални резултати, че тази разлика се изравнява. GLM-5 не е просто играчка, която може да се използва за демонстрации, а е инструмент за производителност, който наистина може да ви помогне да вършите работа, да изграждате системи, да решавате дълги задачи и сложни проблеми. **Най-важното е, че е с отворен код.** Това означава, че всеки разработчик, всяка компания може да има първокласен AI архитект на по-ниска цена. В момента Coding Plan на GLM се продава много бързо, официалните лица обявиха, че спешно разширяват капацитета и основното е, че този път се свързват с клъстер от десет хиляди карти с местни чипове. Въпреки това, поради увеличените инвестиции в изчислителна мощност, цената се е увеличила, но за щастие преди това си взех Max пакет. Тук също може да се види, че от чиповете до моделите, от основната изчислителна мощност до приложенията от най-високо ниво, ние изграждаме набор от напълно наши собствени, водещи в света AI технологии. 2026 г. е предопределена да бъде година на експлозия на AI приложения и също така по-луда година. Ако и вие искате да изпитате усещането да имате първокласен AI архитект, опитайте GLM-5.Предпоставката е, че трябва да успеете да грабнете Max пакета, хаха.
Published in Technology

You Might Also Like

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктураTechnology

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура Въведение С ус...

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезнеTechnology

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 С развитието на дълбокото обучение в различни области, все повече учебни ресурси и инструменти се ...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 С бързото развитие на изкуствения интелект, AI агенти (AI Agents) станаха гореща тема в тех...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 В днешния ден, когато технологиите напредват с бързи темпове, изкуственият интелект (AI...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 В бързо развиващата се област на облачните изчисления, Amazon Web Services (AWS) винаги е била л...