Avatud lähtekoodiga maailma Opus hetk: kas GLM-5 suudab Agentic Codingu teatepulga vastu võtta?

Kui sa küsid arendajalt, mis on AI programmeerimise kõige masendavam hetk?

Tema vastus on tõenäoliselt see, kui see vea korral mehaaniliselt ütleb: "Vabandust, ma sain valesti aru" ja kordab sama vigast koodi.

Viimase aasta jooksul on Coding suurte mudelite edusammud rohkem väljendunud "genereerimisvõimes": ühe lausega veebilehe, komponendi, väikese mängu genereerimine – 15 sekundiga pikslistiilis veebilehe, laheda SVG ikooni või töötava ussimängu loomine. Need demomaterjalid on piisavalt hämmastavad, kuid ka piisavalt "kerged", need on nagu kõrgtehnoloogilised mänguasjad, mis on toodetud Vibe Codingu (atmosfääri programmeerimise) ajastul. Kuid kui tegemist on suure samaaegsusega arhitektuuri, madalama taseme draiverite kohandamise või keerulise süsteemi ümberstruktureerimisega, muutuvad need "kasvuhoone lilledeks".

Seetõttu on Silicon Valley tuuled hiljuti muutunud.

Olgu selleks Claude Opus 4.6 või GPT-5.3, need tipptasemel suured mudelid hakkavad rõhutama Agentic Codingut: ei püüa "tulemusi sekunditega", vaid täidavad süsteemitasandi ülesandeid planeerimise, lahtivõtmise ja korduva käivitamise kaudu.

Seda paradigma muutust "esiosa esteetikast" "süsteemitehnikaks" peeti varem suletud lähtekoodiga hiiglaste monopoliks. Alles pärast GLM-5 testimist mõistsin, et avatud lähtekoodiga kogukonna "arhitektide ajastu" on alanud varem.

"Esiosast" "süsteemitehnikaks"

Varem, kui räägiti AI Codingust, tuli enamasti meelde tuttav narratiiv – ühe lausega veebilehe genereerimine, väikese mängu tegemine minutiga, laheda dünaamilise efekti loomine kümne sekundiga. Need rõhutavad "visuaalset naudingut": nupud liiguvad, leht on ilus, efektid on rikkalikud.

Kuid need, kes on tõeliselt projekti kohale jõudnud, teavad, et demo genereerimine ei tähenda süsteemi toetamist.

Keeruliste ülesannete raskus ei seisne "koodi kirjutamises", vaid selles, kuidas mooduleid lahti võtta, kuidas olekuid hallata, kuidas erandeid katta, kuidas jõudlust optimeerida ja kas süsteemi keerulisemaks muutumisel on võimalik säilitada struktuuri stabiilsus.

See on ka põhjus, miks me valisime keerulised ülesanded reaalse testimise objektideks.

GLM-5 positsioon erineb paljudest konkurentidest.

Kui enamik mudeleid on rohkem nagu "suurepärane esiosa" – osav kiiresti interaktiivsete liideste ja visuaalsete efektide genereerimisel, siis GLM-5 on rohkem "süsteemitehnika rollis". See rõhutab mitme mooduli koostööd, pika ahelaga ülesandeid ja tootmiskeskkonnas käivitatava struktuuri stabiilsust.

Selle kontrollimiseks kujundasime kaks täiesti erineva mõõtmega reaalse testimise juhtumit.

Esimene test on pealtnäha lihtne, kuid tegelikult väga süsteemne ülesanne – brauseri ja kaamera abil realiseerida kevadfestivali teemaline interaktiivne mäng "AI visuaalne õhust ilutulestiku juhtimine".

Reaalses testimise videos on näha, et kasutaja seisab kaamera ees ja juhib žestidega ilutulestiku suunda ja rütmi; ilutulestik õitseb õhus, kaasas osakeste efektid ja dünaamilised valgusefektid, üldine interaktsioon on sujuv ja loomulik.

Kuid see ei ole lihtne esiosa dünaamilise efekti projekt. See sisaldab vähemalt järgmisi põhimooduleid: žestide tuvastamine ja visuaalse sisendi töötlemine; žestide koordinaatide kaardistamine käivitusloogikale; ilutulestiku osakeste süsteem ja õitsemise efektid; reaalajas renderdamine ja kaadrisageduse juhtimine; brauseri ühilduvus ja kaamera õiguste erandite käsitlemine; interaktsiooni oleku haldamine ja kasutaja tagasiside mehhanism

Võib öelda, et see on täieliku struktuuriga ja sujuva kogemusega väike interaktiivne süsteem. Reaalse testimise protsessi põhjal ei hakanud GLM-5 kohe kodeerima, vaid planeeris kõigepealt üldise arhitektuuri: kuidas eraldada visuaalse sisendi moodul, juhtimisloogika kiht, renderdamise kiht ja efektide kiht; kuidas andmevoogu edastada; millised osad võivad muutuda jõudluse kitsaskohtadeks.

Pärast seda realiseeris see loogika kiht kihi haaval, alustades žestide tuvastamise andmetöötlusest, jätkates käivitus trajektoori arvutamisega ja lõpetades osakeste plahvatuse efekti parameetrite peenhäälestusega.

Kui renderdamisel esines viivitusi, soovitas see aktiivselt vähendada osakeste arvu ja optimeerida tsükli struktuuri; kui žestide tuvastamisel esines valearvestusi, kohandas see läve ja filtreerimisstrateegiat.

Videos esitatud efekt on "väga loomulik interaktsioon". Kuid selle taga peitub täielik inseneriahel: planeerimine → kirjutamine → silumine → jõudluse optimeerimine → interaktsiooni korrigeerimine.

Lõpuks genereeritud koodi saab otse käivitada, interaktsioon on stabiilne, kaadrisagedus on sujuv ja erandolukordi saab käsitleda. Veelgi olulisem on see, et selle tööviis näitab selget süsteemset mõtlemist: moodulite piirid on selged, loogiline kihistamine on mõistlik, selle asemel, et kuhjata kõik funktsioonid ühte faili.

Teine juhtum testib struktuurisüsteemi võimet. Seda stsenaariumi võib öelda, et see on meediatöö igapäevane – intervjuu stenogrammi importimine, sisu kokkuvõtmine, teemade nurkade ja ideede väljundamine.

Reaalses testimises on näha, et tööprotsess on väga otsene: ma kleepisin hiljuti intervjuu stenogrammi sisu, mudel hakkas analüüsima ja seejärel väljastas sisu kokkuvõtte ja teemade nurgad. Tulemuste põhjal on selle genereeritud teemade nurgad endiselt väga operatiivsed.

Võrreldes visuaalse interaktsiooni süsteemiga tundub helisalvestise korrastamine lihtne, kuid see tegelikult testib mudeli "struktuurset abstraktsioonivõimet". Tõeline intervjuu helisalvestis on sageli väga struktureerimata: vaated hüppavad, teave kordub ning põhi- ja kõrvalteemad on põimunud. Seega näitab GLM-5 selles juhtumis oma võimet süsteemi tasandil.

Esiteks on teema tuvastamise ja põhiliini väljavõtmise võime. Mudel ei genereerinud kokkuvõtet algteksti järjekorras, vaid otsustas kõigepealt, mis on põhiteema, ja seejärel korraldas sisu selle teema ümber. See tähendab, et see viis sisemiselt läbi skaneerimise, et tuvastada, milline teave kuulub põhiliini, milline on täiendus või müra. See võime on sisuliselt planeerimisvõime, see tähendab, et enne väljundamist luuakse kõigepealt abstraktne struktuuriraamistik.

Teiseks on modulaarne ümberkorraldamise võime. See liigitab erinevates lõikudes hajutatud seotud vaated samasse moodulisse. See lõikudeülene integreerimisvõime näitab, et mudelil on pikkade tekstide töötlemisel globaalne järjepidevus.

Kolmandaks on loogilise järjestuse aktiivne kohandamise võime. Tegelikult väljundatud teemad erinevad sageli algse helisalvestise järjekorrast. On näha, et GLM-5 on ümber korraldanud tasemeid vastavalt põhjuslikele seostele või argumenteerimisloogikale. See peegeldab otsustusvõimet, mis "loogika on prioriteetsem kui algne sisendjärjekord". See "esmalt struktuur ja seejärel väljund" mudel on süsteemitehnika mõtlemise tuum.

Need kaks juhtumit, üks on reaalajas visuaalse interaktsiooni süsteem ja teine on meediainfo struktuuri töötlemise süsteem, tunduvad täiesti erinevad. Kuid need kontrollivad sama asja – GLM-5-l on täielik ülesande suletud ahela võime: planeerimine → täitmine → silumine → optimeerimine.

Ilutulestiku mängus väljendub see moodulite kihistamises, jõudluse optimeerimises ja erandite käsitlemises; helisalvestise protsessoris väljendub see teema hindamises, struktuuri lahtivõtmises ja loogilises ümberkorraldamises. Nende ühine joon on see, et mudel ei peatu "tulemuste genereerimisel", vaid säilitab jätkusuutlikult arenevat struktuuri.

Ma proovisin jätkuvalt suhteliselt keerulist ülesannet "ehitada minimaalne operatsioonisüsteemi tuum". Selles reaalses testis. Tegelikult väärib märkimist mitte see, et videos olev kood lõpuks töötab, vaid GLM-5 käitumisviis kogu protsessi jooksul.

See ei hakanud kohe pärast ülesande saamist genereerima, vaid selgitas kõigepealt ülesande piire, võttis aktiivselt moodulid lahti, planeeris süsteemi struktuuri ja seejärel sisenes realiseerimisetappi. See "struktuur ees" tee on sisuliselt eespool mainitud insenerimõtlemine – kõigepealt määratlege, kuidas süsteem on üles ehitatud, ja seejärel arutage konkreetseid rakenduse üksikasju, selle asemel, et kirjutada ja kokku panna.

Mitmes kirjutamise, käivitamise, veateadete ja paranduste tsüklis ei esinenud GLM-5-l ka struktuuri kokkuvarisemist. Iga muudatus tehti olemasoleva arhitektuuri ümber, selle asemel, et see ümber lükata või kohapeal parandusi teha. See näitab, et see säilitab sisemiselt täieliku süsteemimudeli ja suudab pika ahelaga ülesannetes säilitada järjepidevuse. Paljud mudelid on pärast konteksti pikendamist altid vastuoludele, samas kui video esitus peegeldab just selle pidevat mälu üldise struktuuri kohta.

Samuti on olemas viis, kuidas see vigu käsitleb. Kui ilmneb veateade, ei peatu see "võib-olla on probleem mingis koodireas" pinnapealsel oletusel, vaid otsustab kõigepealt vea tüübi, eristab loogilisi probleeme, keskkonnaprobleeme või sõltuvuskonflikte ja seejärel planeerib tõrkeotsingu tee. See on strateegiline silumine, mille eesmärk on parandada probleemide tee.

Kui kombineerida tööriistade kutsumisega, on see võime veelgi ilmsem. See ei anna mitte ainult käskude soovitusi, vaid kombineerib ka aktiivse terminali ajastamise, logide analüüsi, keskkonna parandamise ja jätkab seejärel ülesande edendamist. See käitumine on juba veidi lähedane "automaatsele juhtimisele" inseneri edendamisele. Kui eesmärki pole saavutatud, jätkab see iteratsiooni.

Kõigepealt planeerimine ja seejärel täitmine, struktuuri stabiilsuse säilitamine pikas ahelas, probleemide strateegiline tõrkeotsing ja eesmärgi ümber pidev edendamine – just süsteemitehnika jaoks vajalike nelja põhivõime kattumine võimaldab GLM-5-l hakata esitama inseneri tööviisile lähedast käitumismustrit.

Miks saab GLM-5 vastu võtta "arhitekti" teatepulga?

Kui esimese osa reaalsed testid tõestasid, et GLM-5 "suudab keerulist tööd teha", siis järgmine küsimus on: millega see seda suudab? Vastus peitub selle taga peidus olevas "inseneritaseme käitumismustris".

Põhipunkt on see, et GLM-5 on ilmselt kasutusele võtnud Claude Opus 4.6-le sarnase mõttelise ahela enesekontrolli mehhanismi.

Reaalses kasutuses on tunda, et see ei hakka kohe pärast ülesande saamist "koodi täitma", vaid viib taustal läbi mitu loogilist deduktsiooni: ennustab moodulite vahelisi sidemeid, väldib aktiivselt lõputuid tsükleid, avastab eelnevalt ressursikonflikte ja piirtingimuste probleeme. Selle käitumise otsene muutus on see, et tagamaks, et skeem on inseneritehniliselt põhjendatud, on see valmis aeglustuma ja probleemi täielikult läbi mõtlema.

Keerulistes ülesannetes annab GLM-5 kõigepealt selge moodulite lahtivõtmise: millistest alamoodulitest süsteem koosneb, mis on iga mooduli sisend ja väljund, milliseid osi saab paralleelselt edendada ja millised tuleb järjestikku lõpule viia. Seejärel vallutab see need ükshaaval, selle asemel, et kirjutada ja mõelda. See muudab selle tööviisi rohkem nagu tõeline insener: kõigepealt joonistage arhitektuuridiagramm ja seejärel kirjutage rakenduse üksikasjad. On selgelt tunda, et sellel on "visadus mitte peatuda enne, kui probleem on täielikult lahendatud", selle asemel, et lõpetada pealiskaudselt pärast näiliselt õige osa valmimist.

See erinevus on eriti ilmne traditsiooniliste Coding mudelitega võrreldes. Varem libisesid paljud mudelid veateate korral kiiresti tuttavasse režiimi: vabandamine, veateate kordamine, kinnitamata parandusettepaneku andmine; kui see uuesti ebaõnnestub, hakkab see kordama ligikaudseid vastuseid. GLM-5 käsitlemisviis on rohkem nagu vanem arhitekt. Reaalses testis, kui projekt ei saanud keskkonna sõltuvusprobleemide tõttu töötada, ei peatanud see pinnapealset veateadet, vaid analüüsis aktiivselt sõltuvuspuud (Dependency Tree), et teha kindlaks konflikti allikas, ja seejärel juhendas OpenClaw'i keskkonna parandamiseks.

Kogu protsess on rohkem nagu "automaatne juhtimine" juurutamine: mudel ei reageeri passiivselt, vaid loeb pidevalt logisid, parandab teid ja kontrollib tulemusi.

Teine sageli tähelepanuta jäetud, kuid süsteemitehnikas äärmiselt oluline võime on konteksti terviklikkus.

GLM-5 miljonitasemel Token aken võimaldab tal samas kontekstis mõista kogu projekti koodistruktuuri, ajaloolisi muudatusi, konfiguratsioonifaile ja käituslogisid. See tähendab, et see suudab juba globaalsest vaatenurgast hinnata, milliseid mooduleid muudatus ahelreaktsioonina mõjutab. Pika ahelaga ülesannetes määrab see võime otseselt, kas mudel on "tark, kuid lühinägelik" või "stabiilne ja kontrollitav".

Kokkuvõttes on GLM-5 tõesti vastu võtnud "arhitekti" rolli peamiselt seetõttu, et see hakkas probleeme lahendama nagu arhitekt: kõigepealt planeerige, seejärel täitke; pidevalt kontrollige ja pidevalt parandage; keskenduge süsteemi tervikule, mitte ühele punktile.

See on ka peamine põhjus, miks see suudab lõpule viia esimeses osas need süsteemitasandi reaalsed testülesanded.

Avatud lähtekoodiga maailma Opus?

Kui vaadata seda 2026. aasta suure mudeli ökosüsteemis, seisneb GLM-5 väärtus rohkem selles, et see murdis asja, mida varem peaaegu vaikimisi aktsepteeriti: süsteemitasandi intelligentsus näib eksisteerivat ainult suletud lähtekoodiga mudelites.

Varem olid Claude Opus 4.6 ja GPT-5.3 tõepoolest läbinud tee "Agentic Coding": mudel ei püüa enam kohest tagasisidet, vaid täidab planeerimise, lahtivõtmise ja korduva käivitamise kaudu tõeliselt keerulisi inseneriülesandeid. Kuid hind on ka väga kõrge: suure intensiivsusega ülesannete Token tarbimine on äärmiselt kõrge ja täielik süsteemitasandi katse tähendab sageli märkimisväärseid kutsumiskulusid.

GLM-5 pakub siin teistsuguse lahenduse. Avatud lähtekoodiga mudelina toob see "süsteemiarhitekti taseme AI" pilvest ja arvetelt tagasi arendajate enda keskkonda. Saate selle kohapeal juurutada, lasta sellel aega võtta, et närida neid räpaseid, väsitavaid ja suuri töid: logide reguleerimine, sõltuvuste kontrollimine, vana koodi muutmine ja piirtingimuste täiendamine.

Seda võib pidada kuluefektiivsuse struktuuriliseks muudatuseks – arhitektitaseme intelligentsus ei ole enam väheste meeskondade privileeg.

Kui mõista seda erinevust ametialase metafoori abil, on see veelgi intuitiivsem. Sellised mudelid nagu Kimi 2.5 on rohkem nagu esteetiliselt võrgus ja väga interaktiivsed suurepärased esiosa insenerid, kes on osavad One-shot genereerimises, visuaalses esitluses ja kiire tagasiside andmises; samas kui GLM-5 stiil on ilmselgelt erinev, see on rohkem nagu kogenud süsteemiarhitekt, kes hoiab joont ja rõhutab loogikat: keskendub moodulite suhetele, eranditeedele, hooldatavusele ja pikaajalisele stabiilsele tööle.

Selle taga on tegelikult programmeerimise AI selge ametialane edasiminek – püüdlus "näeb hea välja" Vibe Codingust, rõhutades vastupidavust ja inseneridistsipliini.

Veelgi olulisem on see, et GLM-5 ilmumine muudab ühe inimese ettevõtte kontseptsiooni paremini teostatavaks.Kui arendajal on kohapeal AI-partner, kes mõistab süsteemidisaini, suudab pikka aega töötada ja end ise parandada, siis paljud inseneritööd, mis varem nõudsid meeskonna suurust, hakkavad kokku tõmbuma üksikisiku kontrolli alla. Järgmisena on GLM-5-l potentsiaal saada ühemehefirmas "digitaalseks partneriks", kes vastutab põhilise inseneritöö teostamise eest.

Avatud lähtekoodiga maailma Opus hetk: kas GLM-5 suudab Agentic Codingu teatepulga vastu võtta?

You Might Also Like

Claude Code Buddy muutmise juhend: Kuidas saada sädelevat legendaarset lemmiklooma

Obsidian tutvustas Defuddle'i, viies Obsidian Web Clipperi uuele tasemele

OpenAI üllatavalt kuulutas välja "kolme ühes": brauser + programmeerimine + ChatGPT ühinemine, siseinfo tunnistab, et eelmisel aastal tehti valeotsuseid

2026, ära sunni end "distsipliini"! Tee need 8 väikest asja, tervis tuleb loomulikult

Need emad, kes püüavad kaalust alla võtta, kuid ei saa seda teha, on kindlasti siin kinni jäänud

AI Brauser 24 tunni stabiilse töö juhend