智谱GLM-5这次开源,让高级程序员也危险了...

2/13/2026
5 min read
**真的,2026年的AI比25年疯太多了。** 最近我这个一天16个小时泡在AI里面的人,都有点追不上AI进化的速度。感觉每天一睁眼,世界就变了个样。 这不,昨天深夜,智谱又放了个大招,直接**开源**了他们目前**最强**的旗舰模型:**GLM-5**。 在全球权威的Artificial Analysis榜单里面,**GLM-5超越Gemini干到了全球第四、开源第一!** ![图片](/uploads/wechat-1770959913536-oik3pqi.png) 还真是如我所料啊,记得上次GLM-4.7发布的时候,我就在文章里跟兄弟们预测了一波:盲猜GLM-4.8或者GLM-5将在春节前夕发布,没想到真来了,哈哈😄 而且这次的版本号终于不像之前那样4.5、4.6、4.7这样挤牙膏式的更新了,这次直接干到了5.0。 这就说明,不是什么小修小补,是底座能力的大跨越。 **先给大家介绍一下,这次GLM-5到底更新了啥:** 简单来说,之前的模型,大家普遍都在卷Vibe Coding,就是所谓的一句话生成,看谁生成的网页特效更炫酷,看谁能一句话搓个炫酷的游戏。 但GLM-5这次不跟你卷这个了(终于!),它把大模型的能力从写代码,提升到能构建系统。 什么意思呢?它的重心不再是写漂亮的前端页面,而是进化成了一个能干脏活、累活、做长任务的系统架构师。 强调的是Agentic Engineering,也就是智能体工程能力。 我看了下官方的数据,参数规模从**355B干到了744B(激活40)**,预训练数据从**23T提升到了28.5T**。 在SWE-bench-Verified这个公认的编程基准测试里,得分77.8,直接把Gemini 3 Pro甩在了身后,**和目前公认的最强闭源模型Claude Opus 4.5可以说是不相上下。** ![](/uploads/wechat-1770959913632-3di12gf.png) **目前在z.ai上面就可以免费使用:** ![](/uploads/wechat-1770959913681-xl76jd1.png) **开源地址:** GitHub:https://github.com/zai-org/GLM-5 Hugging Face:https://huggingface.co/zai-org/GLM-5 ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5 其实在前几天,**X上就突然冒出来一个叫Pony的神秘模型。** 当时很多朋友都在猜,这个Pony到底是哪路神仙?众说纷纭 其实代号Pony的模型就是GLM-5,至于为什么叫Pony呢,大概是因为马年快到了吧🤔。 我当时也第一时间从OpenRouter把Pony接入到Claude Code里试用了一下,说实话,真滴很强(在X上热度也是非常高)。 **只花了7分钟,一次性生成了一个API中转站!** 虽然还是MVP Demo,但是页面功能已经很齐全了,而且包含后端逻辑,以及数据库,数据是动态的,麻雀虽小五脏俱全。 ![](/uploads/wechat-1770959913845-kkpqw2d.png)在深度体验后,我发现GLM-5在制定计划的时候,那种味道,太像Claude Opus了。 熟悉Claude Opus的朋友都知道,在干活之前,可以用它会给你列一个非常详细、逻辑严密的计划。 GLM-5现在也有了这个能力。 比如,我有一个一直想做,但是因为懒一直没动手的事儿。 我手头有Gemini、ChatGPT、Kimi、智谱等等一堆会员账号。 平时写文章或者查资料的时候,有些问题我经常会想听听多个AI的意见,综合对比一下。

მაშინ მომიწევს მრავალი ბრაუზერის ფანჯრის გახსნა, სხვადასხვა ფანჯრებს შორის კოპირება და ჩასმა მრავალჯერ, შემდეგ კი ფანჯრების მონაცვლეობით გადართვა შედეგების სანახავად.

მართალია, ეს არ არის დიდი საქმე, მაგრამ ძალიან მაღიზიანებს, როცა ბევრჯერ მიწევს ამის გაკეთება.

მაინტერესებდა, შესაძლებელია თუ არა ბრაუზერის დანამატის გაკეთება, რომელიც ერთ ფანჯარაში ერთდროულად გაუგზავნის ერთსა და იმავე კითხვას ამ ოთხი AI-ის ვებ გვერდს და შემდეგ დანამატში მიიღებს პასუხებს?

მაგრამ ეს საკმაოდ რთულია, რადგან თითოეული AI ვებსაიტის სტრუქტურა განსხვავებულია და არსებობს სხვადასხვა დაცვის მექანიზმები, ამიტომ საჭიროა მათი DOM სტრუქტურის ანალიზი.

ამიტომ, ეს რთული ამოცანა GLM-5-ს მივანდე.

Claude Code-ის Plan Mode-ის ჩართვით, ჯერ გეგმა შევადგინე.

შემდეგ ის ჩემთან ურთიერთობს და ჩემს აზრს მეკითხება:

საბოლოო გეგმა ძალიან დეტალურია, მართლა ძალიან გრძელია, 633 სტრიქონი აქვს..

შემდეგ გეგმის მიხედვით დაიწყო მუშაობა და მოულოდნელად პირველი ნაბიჯის ინიციალიზაციას 50 წუთზე მეტი დასჭირდა..

ამ პროცესში მან ავტომატურად გამოიძახა Playwright MCP ინსტრუმენტი, თავად გახსნა ბრაუზერი და ეწვია რამდენიმე AI ვებსაიტს.

ის ნამდვილი პროგრამისტივით ამოწმებს ელემენტებს, აანალიზებს სად არის შეყვანის ველი, როგორია გაგზავნის ღილაკის Class, როგორ მიიღოს დაბრუნებული ტექსტის ნაკადი... მთელი პროცესი სრულიად ავტომატურია, ერთი ხაზი კოდი არ დამიწერია.

PS: დამავიწყდა ეკრანის ჩაწერა, რადგან ამავდროულად სხვა ფანჯარაში სხვა დავალებას ვასრულებდი.

ლოდინი ღირდა, ერთჯერადი კითხვის დასმის და მთელი ქსელის AI-ის ერთდროული პასუხის დანამატი ასე ცხელ-ცხელი გამოვიდა.

ეს ზუსტად ის არის, რაც მჭირდება~

გარდა ამისა, ადრე ხომ გავაკეთე ციფრული ადამიანის მარკეტინგული ვიდეოების ერთი ღილაკით გენერირების პლატფორმა.

მოგვიანებით, უკეთესი გამოცდილების მისაღებად, ფრონტენდი გადავაკეთე და ამ გადაკეთებამ მთელი პროექტი არეულობად აქცია: ფრონტენდისა და ბექენდის ინტერფეისები არ ემთხვეოდა, ბექენდის ზოგიერთი ძველი ლოგიკა ახალი ფრონტენდის წინაშე არ მუშაობდა, ძალიან ბევრი შეცდომა იყო და გამოსწორება ძალიან რთული იყო.

ამჯერად, Claude Code-ში Plan Mode ჩავრთე და შეცდომების პოვნის და გამოსწორების მთავარი პროცესი GLM-5-ს მივანდე.

ჯერ დეტალური გეგმა გამოვიდა:

გეგმის სისწორეში დარწმუნების შემდეგ, დავუშვი, რომ ემუშავა (პროცესში გამოიყენებოდა ბრაუზერის mcp კონტროლისთვის).

მისი შესრულების სიჩქარე არ არის სწრაფი.

მაგრამ ეს არ არის მოდელის ბრალი, ხშირად ვხედავდი, რომ Token-ის მოხმარების სიჩქარე თვალსაჩინოდ ათასამდე იზრდებოდა წამში.

მაგრამ რადგან დავალება ძალიან რთული იყო, მას მუდმივად სჭირდებოდა თვითრეფლექსია, ინსტრუმენტების გამოძახება და ტესტების გაშვება.

ასევე, გარკვეული დრო იხარჯებოდა დამოკიდებულებების ჩამოტვირთვაზე ან ბრძანებების შესრულებაზე.

ამ შეცდომების გამოსწორების დავალებას ასევე 40 წუთზე მეტი დასჭირდა.

შესაძლოა, ზოგიერთმა თქვას, 40 წუთი? მე უკვე დავასრულებდი.

ემმმ, მაგრამ ამ 40 წუთის განმავლობაში ეკრანის ჩაწერას ჩავრთავდი, ვიდეოებს ვუყურებდი და ძაღლსაც კი ვასეირნებდი.

ის კი მთელი ყურადღებით მეხმარებოდა და ასრულებდა ისეთ სამუშაოს, რომელიც ყველაზე მეტად მაღიზიანებდა - შეცდომების პოვნას და გადაკეთებას.

ნუ შეხედავთ, რომ ნელა ასრულებს, მაგრამ საბოლოო შედეგი ძალიან მნიშვნელოვანია.

როგორც კი გავუშვი, პრობლემები ძირითადად მოგვარებული იყო.

გთხოვთ, იხილოთ VCR:

აქ არის რამდენიმე ეფექტი, რომელიც მოგვიანებით ტესტირებისას აღმოვაჩინე და შემდეგ გავასწორე და გავაუმჯობესე.

მაგრამ შეცდომების გამოსწორების და ფუნქციების გაუმჯობესების მხრივ, ნამდვილად მშვიდად ვარ, როცა მას ვანდობ.

ადრე სხვა AI-ს ვიყენებდი შეცდომების გამოსასწორებლად და ხშირად ვღელავდი, რომ შეცდომები უფრო მეტი გახდებოდა და პროექტი უფრო მეტად აირეოდა, ტიპურია, როცა ერთ კედელს ანგრევ და მეორეს აშენებ..

ამ პრობლემის თავიდან ასაცილებლად, სხვადასხვა საინჟინრო საშუალებების გამოყენება მიწევდა AI-ს შესაზღუდად.

მაგალითად, ყოველ ჯერზე ხაზს ვუსვამდი დიაპაზონს, ან ამას წესებში ვწერდი, ან ყოველ ჯერზე მხოლოდ ერთ შეცდომას ვასწორებდი და ყოველი გამოსწორების შემდეგ სხვა ფუნქციებსაც ვამოწმებდი... მოკლედ, ძალიან რთული იყო.

მაგრამ GLM-5-ის გამოყენებით შეცდომების გამოსწორების გამოცდილება სრულიად შეიცვალა.

მე მხოლოდ სიტუაციის აღწერა, შეცდომის ჟურნალების მიცემა და იმის თქმა მჭირდება, თუ რა შედეგის მიღება მსურს.

მას თითქმის ყოველთვის შეუძლია წარმატებით გაასწოროს და ეს სრულიად არ იმოქმედებს სხვა ფუნქციებზე.

უფრო მეტიც, ერთ საუბარში პირდაპირ მივაწოდე მთელი პროცესის განმავლობაში აღმოჩენილი ოთხი განსხვავებული შეცდომა და მან ისინი რიგრიგობით გაასწორა.

ასეთი სტაბილური შეგრძნება მართლა ძალიან სასიამოვნოა.

ახლა შემიძლია მშვიდად ვანდო GLM-5-ს ნებისმიერი რთული განვითარების ამოცანის შესრულება და ის ძირითადად არ უშვებს შეცდომებს.

თუ ხანდახან პრობლემები ჩნდება, შემიძლია Claude Code-ში უკან დაბრუნების ბრძანება შევასრულო და თავიდან დავიწყო.

GLM-5-ის გამოყენებით პროექტის ოპტიმიზაციის შემდეგ, ყველა პროცესი ძირითადად მოგვარებულია.

**მეც მალე ვაპირებ ამ პროექტის ღია კოდის სახით გამოქვეყნებას (ჯერ კიდევ საჭიროა სხვადასხვა მოდელის API-ების ამოღება და კონფიგურაციად გადაქცევა).** **„ბოლო“** GLM-5-ის გამოცდილების შემდეგ, ჩემი ყველაზე დიდი შთაბეჭდილებაა: **ჩინური AI ნამდვილად წამოდგა ფეხზე.** რამდენიმე დღის წინ, ByteDance-მა გამოუშვა Seedance 2.0, რაც ადასტურებს, რომ ჩინურმა მოდელებმა ვიდეოების გენერირების სფეროში მსოფლიო დონის მიაღწიეს და პირდაპირ გადაუსწრეს Sora2-სა და Veo3.1-ს. ამჯერად კი, ZhiPu GLM-5-ის გამოშვებით, კიდევ ერთ მძიმე კონკურენციის სფეროში, AI Coding-ში, მოულოდნელზე უკეთესი პასუხი გაგვცეს. ადრე სულ ვამბობდით, რომ ჩინურ მოდელებს ლოგიკურ მსჯელობაში, კოდის წერაში, GPT-სთან, Claude Opus-თან და Gemini-სთან შედარებით ჩამორჩენა ჰქონდათ. მაგრამ დღეს, GLM-5-მა რეალური შედეგებით გვაჩვენა: ეს ჩამორჩენა თანდათანობით ივსება. GLM-5 არ არის მხოლოდ სათამაშო, რომელიც დემო ვერსიისთვის გამოდგება, ის არის პროდუქტიულობის ინსტრუმენტი, რომელიც ნამდვილად დაგეხმარებათ მუშაობაში, სისტემების აწყობაში, გრძელვადიანი და რთული პრობლემების გადაჭრაში. **ყველაზე მთავარი კი ის არის, რომ ის ღია კოდისაა.** ეს ნიშნავს, რომ ყველა დეველოპერს, ყველა კომპანიას, შეუძლია უფრო დაბალ ფასად ჰყავდეს უმაღლესი დონის AI არქიტექტორი. ამჟამად GLM-ის Coding Plan უკვე გაყიდვების პიკზეა, ოფიციალურმა განცხადებამ გამოაცხადა, რომ სასწრაფოდ აფართოებენ სიმძლავრეებს და რაც მთავარია, ამჯერად ჩინური ჩიპების ათასობით კარტიან კლასტერს აერთებენ. თუმცა, გამოთვლითი სიმძლავრის გაზრდილი ინვესტიციის გამო, ფასი ოდნავ გაიზარდა, საბედნიეროდ, მე ადრე Max პაკეტი შევიძინე. აქედან ასევე ჩანს, რომ ჩიპებიდან მოდელებამდე, ქვედა დონის გამოთვლითი სიმძლავრიდან ზედა დონის აპლიკაციებამდე, ჩვენ ვქმნით სრულიად საკუთარ, მსოფლიო დონის AI ტექნოლოგიების დასტას. 2026 წელი აუცილებლად იქნება AI აპლიკაციების აფეთქების წელი, ასევე უფრო გიჟური წელი. თუ თქვენც გსურთ განიცადოთ უმაღლესი დონის AI არქიტექტორის ყოლის შეგრძნება, სასწრაფოდ სცადეთ GLM-5.

მთავარია Max პაკეტის ყიდვა მოასწრო, ჰაჰა.

Published in Technology

You Might Also Like

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელოTechnology

როგორ გამოვიყენოთ ღრუბლოვანი კომპიუტერული ტექნოლოგიები: შექმენით თქვენი პირველი ღრუბლოვანი ინფრასტრუქტურის სრული სახელმძღვანელო

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრებაTechnology

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ინჟინრების ტიტული გაქრება

გაფრთხილება! Claude Code-ის მამა პირდაპირ ამბობს: 1 თვის შემდეგ Plan Mode-ის გამოყენება აღარ იქნება საჭირო, პროგრამული ი...

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსებიTechnology

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები

2026 წლის 10 საუკეთესო ღრმა სწავლების რესურსები ღრმა სწავლების სწრაფი განვითარებით სხვადასხვა სფეროში, სულ უფრო მეტი სას...

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზიTechnology

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი

2026 წლის 10 საუკეთესო AI აგენტი: ძირითადი მახასიათებლების ანალიზი შესავალი ხელოვნური ინტელიგენციის სწრაფი განვითარების ...

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლებაTechnology

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება

2026 წლის 10 საუკეთესო AI ინსტრუმენტი: ხელოვნური ინტელექტის რეალური პოტენციალის გათავისუფლება დღეს ტექნოლოგიის სწრაფი გა...

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსიTechnology

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი

2026 წლის საუკეთესო 10 AWS ინსტრუმენტი და რესურსი ბრიტანული სწრაფად განვითარებადი ღრუბლოვანი კომპიუტინგის სფეროში, Amazo...