智谱GLM-5 यावेळी ओपन सोर्स, उच्च प्रतीचे प्रोग्रामरही धोक्यात...
खरंच, 2026 मधील AI 25 पेक्षा खूपच जास्त वेगाने वाढत आहे.
आजकाल मी दिवसाचे 16 तास AI मध्ये घालवतो, तरीही मला AI च्या प्रगतीचा वेग पकडता येत नाहीये. असं वाटतं की रोज डोळे उघडल्यावर जगच बदलून गेलं आहे.
काल रात्री, झी-फूने (Zhipu) आणखी एक मोठा धमाका केला, त्यांनी त्यांचा सध्याचा सर्वात शक्तिशाली फ्लॅगशिप मॉडेल GLM-5 ओपन सोर्स केला आहे.
जागतिक स्तरावरच्या Artificial Analysis च्या यादीत, GLM-5 ने Gemini ला हरवून जगात चौथा आणि ओपन सोर्समध्ये पहिला क्रमांक पटकावला आहे!

माझ्या अपेक्षेप्रमाणेच झाले. आठवतंय, GLM-4.7 लाँच झाला तेव्हा मी माझ्या लेखात भविष्यवाणी केली होती: GLM-4.8 किंवा GLM-5 लवकरच लाँच होईल, आणि ते खरं ठरलं, हा हा 😄
आणि यावेळी, आवृत्ती क्रमांक (version number) 4.5, 4.6, 4.7 अशा लहान अपडेटसारखा नाही, तर थेट 5.0 आहे.
याचा अर्थ, हे फक्त छोटे बदल नाहीत, तर मूलभूत क्षमतेत मोठी वाढ झाली आहे.
आता GLM-5 मध्ये काय नवीन आहे, ते पाहूया:
सोप्या भाषेत सांगायचं तर, आधीचे मॉडेल 'Vibe Coding' वर लक्ष केंद्रित करत होते, म्हणजे एका वाक्यात काहीतरी तयार करणे. कोण किती आकर्षक वेब पेज बनवू शकतो किंवा कोण एका वाक्यात छान गेम बनवू शकतो, यावर स्पर्धा होती.
पण GLM-5 आता या शर्यतीत नाहीये (अखेर!). या मॉडेलने मोठ्या भाषेची क्षमता (large language model) कोड लिहिण्यापासून ते सिस्टीम तयार करण्यापर्यंत वाढवली आहे.
म्हणजे, याचं लक्ष आता आकर्षक फ्रंट-एंड पेज बनवण्यावर नाही, तर ते कठीण आणि जास्त वेळ लागणारी कामं करणाऱ्या सिस्टीम आर्किटेक्टमध्ये विकसित झाले आहे.
हे Agentic Engineering, म्हणजे इंटेलिजेंट एजंट (intelligent agent) च्या क्षमतेवर जोर देते.
मी अधिकृत आकडेवारी पाहिली, त्यानुसार पॅरामीटरचा आकार 355B वरून 744B (ऍक्टिव्ह 40) पर्यंत वाढला आहे आणि प्री-ट्रेनिंग डेटा 23T वरून 28.5T पर्यंत वाढला आहे.
SWE-bench-Verified मध्ये, जे प्रोग्रामिंगसाठी एक मान्यताप्राप्त बेंचमार्क आहे, त्यात 77.8 गुण मिळवले आहेत, जे Gemini 3 Pro पेक्षा जास्त आहेत आणि सध्याचं सर्वात शक्तिशाली क्लोज्ड-सोर्स मॉडेल Claude Opus 4.5 च्या जवळपास आहे.

हे सध्या z.ai वर मोफत वापरण्यासाठी उपलब्ध आहे:

ओपन सोर्स ॲड्रेस:
GitHub: https://github.com/zai-org/GLM-5
Hugging Face: https://huggingface.co/zai-org/GLM-5
ModelScope: https://modelscope.cn/models/ZhipuAI/GLM-5
खरं तर, काही दिवसांपूर्वी, X वर Pony नावाचं एक रहस्यमय मॉडेल अचानक समोर आलं.
तेव्हा बरेच लोक अंदाज लावत होते की हे Pony कोण आहे? वेगवेगळे तर्क लावले जात होते.
Pony हे GLM-5 चं कोडनेम (codename) आहे. Pony नाव का ठेवलं, कारण लवकरच घोड्याचं वर्ष (Chinese zodiac) येत आहे, म्हणून कदाचित 🤔.
मी OpenRouter वरून Pony ला Claude Code मध्ये वापरून पाहिलं आणि खरं सांगतो, ते खूपच शक्तिशाली आहे (X वर त्याची खूप चर्चा आहे).
फक्त 7 मिनिटांत, त्याने API इंटरमीडिएट स्टेशन (intermediate station) तयार केले!
हे MVP डेमो असलं तरी, पेजची कार्यक्षमता पूर्ण आहे आणि त्यात बॅकएंड लॉजिक (backend logic) आणि डेटाबेस (database) आहे. डेटा डायनॅमिक (dynamic) आहे, म्हणजे लहान पॅकेजमध्ये सर्व काही आहे.
याचा अनुभव घेतल्यानंतर, मला असं वाटलं की GLM-5 योजना बनवताना Claude Opus सारखंच काम करतं.
Claude Opus वापरणाऱ्यांना माहीत आहे की, काम सुरू करण्यापूर्वी ते एक विस्तृत आणि तर्कशुद्ध योजना तयार करतं.
आता GLM-5 मध्येही ही क्षमता आहे.
उदाहरणार्थ, मला एक काम करायचं होतं, पण आळसामुळे मी ते टाळत होतो.
माझ्याकडे Gemini, ChatGPT, Kimi, Zhipu इत्यादी अनेक अकाउंट्स आहेत.
लेख लिहित असताना किंवा माहिती शोधताना, मला अनेकदा वेगवेगळ्या AI चं मत ऐकायला आवडतं, जेणेकरून मी त्यांची तुलना करू शकेन.मग मला अनेक ब्राउझर विंडो उघडाव्या लागतील, वेगवेगळ्या विंडोमधून कॉपी-पेस्ट करून अनेक वेळा पाठवावे लागतील आणि मग आलटून पालटून विंडो बदलून निकाल पाहावे लागतील.
जरी हे फार मोठे काम नाही, पण वारंवार केल्याने खूप त्रास होतो.
मी विचार करत होतो, असे ब्राउझर प्लगइन बनवता येईल का, जे एकाच विंडोमध्ये, एकाच वेळी चारही AI च्या वेबपेजवर एकच प्रश्न पाठवेल आणि प्लगइनमध्येच एकत्रितपणे उत्तरे मिळतील?
पण हे काम थोडे कठीण आहे, कारण प्रत्येक AI वेबसाइटची रचना वेगळी आहे, त्यात विविध सुरक्षा यंत्रणा आहेत, त्यामुळे त्यांच्या DOM संरचनेचे विश्लेषण करावे लागेल.
म्हणून, मी हे किचकट काम GLM-5 कडे सोपवले.
Claude Code चा प्लॅन मोड सुरू करून त्याला आधी योजना बनवायला सांगितली.
मग ते माझ्याशी संवाद साधेल आणि माझे मत विचारेल:
अखेरीस मिळालेली योजना खूपच विस्तृत होती, ती खूप मोठी होती, 633 ओळींची होती..
मग योजनेनुसार काम सुरू केले, पण पहिले प्रोजेक्ट सुरू करायलाच 50 मिनिटे लागली..
या प्रक्रियेत, त्याने आपोआप Playwright MCP टूल वापरले, ब्राउझर उघडले आणि त्या AI च्या वेबसाइटला भेट दिली.
ते एखाद्या खऱ्या प्रोग्रामरप्रमाणे काम करत होते, जसे की घटकांची तपासणी करणे, इनपुट बॉक्स कुठे आहे याचे विश्लेषण करणे, पाठवण्याच्या बटणाचा क्लास कोणता आहे, रिटर्न टेक्स्ट स्ट्रीम कसा मिळवायचा... ही संपूर्ण प्रक्रिया स्वयंचलित होती, मी एकही ओळ कोड लिहिले नाही.
PS: मी स्क्रीन रेकॉर्ड करायला विसरलो, कारण मी त्याच वेळी इतर विंडोमध्ये दुसरे काम करत होतो.
प्रतीक्षा करणे योग्य होते, मला हवे असलेले एकाच वेळी प्रश्न विचारून सर्व AI कडून एकाच वेळी उत्तरे मिळवणारे प्लगइन तयार झाले.
हे अगदी मला हवे असलेलेच आहे~
याव्यतिरिक्त, मी यापूर्वी डिजिटल ह्यूमन मार्केटिंग व्हिडिओ जनरेशन प्लॅटफॉर्म बनवला होता.
नंतर, चांगला अनुभव मिळवण्यासाठी, मी फ्रंटएंडची पुनर्रचना केली, आणि या पुनर्रचनेमुळे संपूर्ण प्रकल्प गोंधळात पडला: फ्रंटएंड आणि बॅकएंड इंटरफेस जुळत नव्हते, बॅकएंडचे काही जुने लॉजिक नवीन फ्रंटएंडसमोर काम करत नव्हते, खूप बग्स होते, आणि ते ठीक करणे खूप कठीण होते.
यावेळी, मी Claude Code मध्ये प्लॅन मोड सुरू केला, आणि GLM-5 ला बग शोधण्याचे आणि दुरुस्त करण्याचे काम सोपवले.
सर्वात आधी एक तपशीलवार योजना तयार केली:
योजना बरोबर असल्याची खात्री झाल्यावर, मी त्याला काम सुरू करायला सांगितले (या प्रक्रियेत ब्राउझर MCP चा वापर केला).
त्याची अंमलबजावणीची गती फारशी जलद नाही.
पण मॉडेल धीमे नाही, बर्याच वेळा, मी टोकनचा वापर पाहिला, एका सेकंदात हजारो टोकन वापरले जात होते.
पण काम खूपच गुंतागुंतीचे असल्याने, त्याला सतत आत्मचिंतन करावे लागते, टूल्स वापरावे लागतात आणि चाचणी घ्यावी लागते.
काही वेळ अवलंबित्व डाउनलोड करण्यात किंवा कमांड कार्यान्वित करण्यात खर्च होतो.
हे दुरुस्तीचे काम पूर्ण व्हायला 40 मिनिटे लागली.
काही मित्र म्हणू शकतात, 40 मिनिटे? तेवढ्यात तर मीच करून टाकले असते.
बरं, त्या 40 मिनिटांत, मी स्क्रीन रेकॉर्डिंग चालू ठेवले, व्हिडिओ पाहिले, आणि कुत्र्याला फिरायला घेऊन गेलो.
आणि ते पूर्ण लक्ष देऊन माझ्यासाठी काम करत होते, तेही डोकेदुखी वाढवणारे बग शोधण्याचे आणि पुनर्रचना करण्याचे काम.
ते हळू काम करत असले तरी, त्याचा परिणाम खूपच चांगला होता.
मी एकदा चालवून पाहिले, आणि बहुतेक समस्या ठीक झाल्या होत्या.
कृपया VCR पाहा:
यामध्ये काही प्रभाव असे आहेत, जे मी स्वतः चाचणी करताना मला लहान बग्स आढळले, आणि मग ते दुरुस्त करून घेतले आणि सुधारित केले.
पण बग्स दुरुस्त करणे आणि कार्ये सुधारणे या बाबतीत, मी त्याच्यावर पूर्णपणे विश्वास ठेवू शकतो.
पूर्वी इतर AI वापरून बग्स दुरुस्त करताना, मला नेहमी भीती वाटायची की बग्स वाढतच जातील, आणि प्रकल्प अधिकच गोंधळलेला होईल, म्हणजे 'इकडचे तिकडे लावणे'.
या समस्ये टाळण्यासाठी, मला विविध अभियांत्रिकी पद्धती वापरून AI वर नियंत्रण ठेवावे लागत होते.
उदाहरणार्थ, प्रत्येक वेळी बदलण्याची व्याप्ती निश्चित करणे, किंवा ते नियमांमध्ये लिहिणे, किंवा प्रत्येक वेळी फक्त एकच बग दुरुस्त करणे, प्रत्येक बदलानंतर, इतर कार्ये तपासावी लागत होती... एकूणच खूप त्रासदायक होते.
पण GLM-5 वापरून बग्स दुरुस्त करण्याचा अनुभव पूर्णपणे बदलला आहे.
मला फक्त परिस्थितीचे वर्णन करायचे असते, एरर लॉग त्याला द्यायचा असतो, आणि मला काय अपेक्षित आहे ते सांगायचे असते.
ते जवळजवळ प्रत्येक वेळी यशस्वीरित्या दुरुस्त करते, आणि त्याचा इतर कार्यांवर अजिबात परिणाम होत नाही.
एवढेच नाही, तर एका संभाषणात, मला संपूर्ण प्रक्रियेत आढळलेले चार वेगवेगळे बग्स मी त्याला सांगितले, आणि त्याने ते सर्व व्यवस्थितपणे दुरुस्त केले.
हा स्थिरतेचा अनुभव खूपच सुखद आहे.
आता मी GLM-5 वर कोणताही गुंतागुंतीचा विकास कार्यान्वित करण्यासाठी विश्वास ठेवू शकतो, त्यात कोणतीही चूक होणार नाही.
क्वचितच काही समस्या आली, तर Claude Code मध्ये रोलबॅक कमांड कार्यान्वित करून, मागे जाऊन पुन्हा करता येते.
GLM-5 वापरून संपूर्ण प्रकल्प सुधारल्यानंतर, सर्व प्रक्रिया व्यवस्थित पार पडल्या.मी लवकरच हा प्रकल्प ओपन सोर्स (Open Source) करण्याची तयारी करत आहे (मला विविध मॉडेल API चा भाग काढून कॉन्फिगरेशनमध्ये रूपांतरित करायचे आहे).
"अखेरीस"
GLM-5 चा अनुभव घेतल्यानंतर, मला सर्वात जास्त काय जाणवले ते म्हणजे: ** Made in India AI खऱ्या अर्थाने उभे राहिले आहे.**
दोन दिवसांपूर्वी, ByteDance चे Seedance 2.0 लाँच झाले, ज्याने हे सिद्ध केले की व्हिडिओ निर्मिती क्षेत्रात चीनचे मॉडेल जगातील पहिल्या क्रमांकावर पोहोचले आहे, थेट Sora2 आणि Veo3.1 ला मागे टाकले आहे.
आणि आता ZhiPu GLM-5 च्या लाँचिंगने AI कोडिंगच्या आणखी एका महत्त्वाच्या क्षेत्रात अपेक्षेपेक्षा जास्त चांगले प्रदर्शन केले आहे.
आम्ही नेहमी म्हणतो की, तार्किक विचार, कोडिंगमध्ये Made in India मॉडेल GPT, Claude Opus आणि Gemini पेक्षा अजूनही मागे आहेत.
पण आज, GLM-5 ने ठोस कामगिरीने दाखवून दिले आहे की: हे अंतर कमी होत आहे.
GLM-5 हे फक्त डेमोसाठी बनवलेले खेळणे नाही, तर ते एक असे उत्पादन आहे जे तुम्हाला काम पूर्ण करण्यात, सिस्टम तयार करण्यात, लांब आणि गुंतागुंतीच्या समस्या सोडवण्यास मदत करते.
सर्वात महत्त्वाचे म्हणजे, ते ओपन सोर्स आहे.
याचा अर्थ असा आहे की, प्रत्येक विकासक (Developer) आणि प्रत्येक कंपनीला कमी खर्चात एक उत्कृष्ट AI आर्किटेक्ट मिळू शकतो.
आणि सध्या GLM च्या कोडिंग प्लॅनची (Coding Plan) खूप विक्री होत आहे, अधिकृत घोषणेनुसार, ते तातडीने क्षमता वाढवत आहेत आणि विशेष म्हणजे, यावेळी Made in India चिप्सचे (Chips) मोठे क्लस्टर (Cluster) वापरले जात आहे.
पण गणनशक्तीमध्ये (Computational Power) वाढ केल्यामुळे, किमती थोड्या वाढल्या आहेत, बरं झालं मी आधीच Max पॅकेज घेतले.
यावरून हे दिसून येते की, चिप्सपासून मॉडेलपर्यंत (Model), मूलभूत गणनशक्तीपासून ते उच्च स्तरावरील ॲप्लिकेशन्सपर्यंत (Applications), आम्ही स्वतःचे जागतिक दर्जाचे AI तंत्रज्ञान तयार करत आहोत.
2026 हे वर्ष AI ॲप्लिकेशन्सच्या (Applications) उद्रेकाचे वर्ष असेल, तसेच ते अधिक वेगाने वाढणारे वर्ष असेल.
जर तुम्हालाही टॉप AI आर्किटेक्ट असल्याचा अनुभव घ्यायचा असेल, तर GLM-5 नक्की वापरून पहा.अट ही आहे की तुम्हाला मॅक्स प्लॅन मिळायला हवा, हा हा.





