Opus-augnablik í opnum hugbúnaði: Getur GLM-5 tekið við keflinu í Agentic Coding?
Ef þú spyrð þróunaraðila, hvað er það sem gerir AI forritun mest pirrandi?
Svarið sem þú færð er líklega vélræna setningin „Afsakið, ég misskildi“ þegar villuboð koma upp, og endurtekning á sömu röngu kóðanum.
Á síðasta ári hefur framfarir í Coding stórum líkönum aðallega komið fram í „framleiðslugetu“: Ein setning til að búa til vefsíður, íhluti, smáleiki - búa til pixla-stíl vefsíðu, flott SVG tákn eða keyranlegan snákaleik á 15 sekúndum. Þessar kynningar eru nógu glæsilegar, en líka nógu „léttar“, þær eru svolítið eins og háþróuð leikföng framleidd á tímum Vibe Coding (stemningsforritunar). En þegar kemur að háþróaðri samtímis arkitektúr, aðlögun undirliggjandi rekla eða flóknum endurskipulagningu kerfa, verða þær „blóm í gróðurhúsi“.
Þess vegna hefur vindáttin í Silicon Valley breyst nýlega.
Hvort sem það er Claude Opus 4.6 eða GPT-5.3, þá byrja þessi helstu stóru líkön að leggja áherslu á Agentic Coding: Ekki leitast við að „fá niðurstöður á sekúndu“, heldur ljúka verkefnum á kerfisstigi með skipulagningu, sundurliðun og endurtekinni keyrslu.
Þessi hugmyndafræðilega breyting frá „framenda fagurfræði“ yfir í „kerfisverkfræði“ var áður talin vera einokun lokaðra risa. Það var ekki fyrr en ég prófaði GLM-5 að ég áttaði mig á því að „arkitekta tímabil“ opna samfélagsins var hafið fyrr en áætlað var.
01
**Frá „framenda“ til „kerfisverkfræði“ **
Áður fyrr, þegar talað var um AI Coding, kom upp kunnugleg saga - ein setning til að búa til vefsíðu, smáleik á einni mínútu, flott hreyfimynd á tíu sekúndum. Þær leggja áherslu á „sjónræna ánægju“: Hnappar hreyfast, síður eru fallegar, áhrifin eru rík.
En þeir sem raunverulega koma inn á verkefnasvæðið vita að það að geta búið til kynningu jafngildir ekki því að geta stutt kerfi.
Erfiðleikarnir við flókin verkefni felast ekki í „að skrifa kóða“, heldur í því hvernig einingum er skipt upp, hvernig á að stjórna stöðu, hvernig á að tryggja undantekningar, hvernig á að hámarka afköst og hvort hægt sé að viðhalda stöðugleika í uppbyggingu þegar kerfið byrjar að verða flókið.
Þetta er líka ástæðan fyrir því að við veljum flókin verkefni sem raunprófunarefni.
Staðsetning GLM-5 er frábrugðin mörgum samkeppnisvörum.
Ef hægt er að segja að flest líkön séu meira eins og „frábærir framendar“ - fær um að búa til fljótleg samskiptaviðmót og sjónræn áhrif, þá hallast GLM-5 meira að „kerfisverkfræðilegu hlutverki“. Það leggur áherslu á samvinnu margra eininga, langar verkefnakeðjur og uppbyggingarstöðugleika sem hægt er að keyra í framleiðsluumhverfi.
Til að staðfesta þetta hönnuðum við tvö raunprófunartilvik með gjörólíkum víddum.
Fyrsta prófið er verkefni sem virðist afslappað en er í raun mjög kerfisbundið - byggt á vafra og myndavél, til að átta sig á „AI sjónrænu loftstýrðu flugeldum“ sem þema gagnvirks leiks fyrir vorhátíðina.
Í raunprófunarmyndbandinu má sjá að notandinn stendur fyrir framan myndavélina og stjórnar stefnu og takti flugeldaskots með bendingum; flugeldarnir blómstra í loftinu, ásamt agnaáhrifum og kraftmiklum ljósáhrifum, og heildarsamskiptin eru slétt og eðlileg.
En þetta er ekki einfalt framenda hreyfimyndaverkefni. Það inniheldur að minnsta kosti eftirfarandi kjarna einingar: bendingagreining og sjónræn inntaksmeðferð; kortlagning bendingahnitanna yfir í skotlogík; flugeldagna kerfi og blómstrandi áhrif; rauntíma flutningur og rammahraðastýring; samhæfni vafra og óeðlileg meðhöndlun myndavélarheimilda; stjórnun samskiptastöðu og endurgjöf notenda
Það má segja að þetta sé lítið gagnvirkt kerfi með fullkomna uppbyggingu og slétta upplifun. Frá raunprófunarferlinu sést að GLM-5 fór ekki beint í kóðun, heldur skipulagði fyrst heildararkitektúrinn: Hvernig á að aðskilja sjónræna inntakseininguna, stjórnunarlogíklagið, flutningslagið og áhrifalagið; hvernig á að senda gagnastrauma; hvaða hlutar gætu orðið flöskuhálsar í afköstum.
Í kjölfarið innleiddi það rökfræði lag fyrir lag, byrjaði á gagnameðferð bendingagreiningar, fór í útreikninga á skotbrautum og síðan í fínstillingu breytna agnasprengingaráhrifa.
Þegar flutningurinn varð hægur lagði hann sjálfkrafa til að fækka ögnum og hagræða lykkjubyggingunni; þegar bendingagreiningin var röng, stillti hann þröskuldinn og síunaraðferðina.
Áhrifin sem birtast í myndbandinu eru „samskipti sem líta mjög eðlilega út“. En það sem endurspeglast á bak við það er heil verkfræðikeðja: skipulagning → skrif → villuleit → afköstshagræðing → samskiptaleiðrétting.
Kóðinn sem myndast að lokum er hægt að keyra beint, samskiptin eru stöðug, rammahraðinn er sléttur og hægt er að meðhöndla óeðlilegar aðstæður. Það sem er mikilvægara er að vinnubrögð þess sýna skýra kerfishugsun: einingamörk eru skýr, rökfræðileg lagskipting er sanngjörn, frekar en að stafla öllum aðgerðum í eina skrá.
Annað dæmið prófar uppbyggingarkerfisgetu. Þetta svið má segja að sé daglegt starf fjölmiðla - flytja inn afrit af viðtali, draga saman innihaldið og gefa út sjónarhorn og hugmyndir að efni.
Í raunprófuninni má sjá að aðgerðarferlið er mjög beint: Ég límdi inn afrit af viðtali frá síðasta tímabili, líkanið byrjaði að greina og gaf síðan út innihaldssamantekt og sjónarhorn að efni. Af niðurstöðunum að dæma eru sjónarhornin sem það bjó til enn mjög framkvæmanleg.
Í samanburði við sjónrænt gagnvirkt kerfi virðist hljóðupptökuskipulag einfalt, en það reynir í raun á „uppbyggingarhæfni“ líkansins. Raunveruleg hljóðupptaka viðtals er oft mjög óskipulögð: sjónarmið hoppa, upplýsingar endurtaka sig og aðal- og aukaþræðir fléttast saman. Þannig að í þessu tilviki er hæfileikinn sem GLM-5 sýnir á kerfisstigi.
Í fyrsta lagi er það þema auðkenningar- og aðalþráðarútdráttargeta. Líkanið býr ekki til útdrátt í upprunalegri textaröð, heldur ákvarðar fyrst hvað er kjarnaefnið og endurskipuleggur síðan innihaldið í kringum þetta efni. Þetta þýðir að það hefur lokið skönnun innbyrðis til að bera kennsl á hvaða upplýsingar tilheyra aðalþræðinum og hvaða tilheyra viðbótum eða hávaða. Þessi hæfileiki er í raun skipulagningarhæfileiki, það er að koma á fót abstrakt uppbyggingargrind áður en framleiðsla fer fram.
Í öðru lagi er það mátssamsetningarhæfileiki. Það mun flokka skyld sjónarmið sem dreifð eru í mismunandi málsgreinum í sömu einingu. Þessi þvermálsgrein samþættingarhæfileiki sýnir að líkanið hefur alhliða samræmi þegar unnið er með langan texta.
Í þriðja lagi er það geta til að stilla rökrétta röð af eigin frumkvæði. Raunveruleg úttaksskrá er oft frábrugðin upprunalegri upptökuröð. Það má sjá að GLM-5 er að endurraða stigum í samræmi við orsakatengsl eða rökrétta röksemdafærslu. Þetta endurspeglar dómgreind sem er „rökrétt á undan upprunalegri inntaksröð“. Þetta „uppbygging fyrst, úttak síðar“ mynstur er kjarninn í kerfisverkfræðilegri hugsun.
Þessi tvö dæmi, annað er gagnvirkt sjónrænt samskiptakerfi og hitt er fjölmiðlaupplýsingauppbyggingarkerfi, virðast gjörólík. En þau staðfesta sama hlutinn - GLM-5 hefur fullkomna verkefnalokunarhæfileika: skipulagning → framkvæmd → villuleit → hagræðing.
Í flugeldaleiknum endurspeglast þetta í lagskiptingu eininga, afköstshagræðingu og óeðlilegri meðhöndlun; í hljóðupptökuvinnslunni endurspeglast þetta í þemaákvörðun, uppbyggingarsundurliðun og rökréttri endursamsetningu. Það sem þau eiga sameiginlegt er að líkanið dvelur ekki við „að búa til niðurstöður“, heldur viðheldur uppbyggingu sem getur þróast sjálfbært.
Ég hélt áfram að reyna tiltölulega flókið verkefni, „að byggja upp mjög einfaldan stýrikerfiskjarna“. Í þessari raunprófun. Það sem er virkilega athyglisvert er ekki að kóðinn í myndbandinu keyrir að lokum, heldur hegðun GLM-5 í öllu ferlinu.
Það fór ekki strax í framleiðslustöðu þegar það fékk verkefnið, heldur skýrði fyrst verkefnamörkin, skipti einingunum af eigin frumkvæði, skipulagði kerfisuppbygginguna og fór síðan inn í framkvæmdarstigið. Þessi „uppbygging fyrst“ leið er í raun verkfræðileg hugsun sem nefnd var áður - skilgreina fyrst hvernig kerfið er samsett og ræða síðan sérstök útfærsluatriði, frekar en að skrifa og setja saman.
Í mörgum umferðum skrifa, keyra, villuboða og leiðrétta, féll uppbyggingin ekki saman hjá GLM-5. Hver breyting er gerð í kringum fyrirfram ákveðna arkitektúr, frekar en að hnekkja henni eða gera staðbundnar lagfæringar. Þetta sýnir að það viðheldur heildstæðu kerfislíkani innbyrðis og getur viðhaldið samræmi í löngum verkefnakeðjum. Mörg líkön hafa tilhneigingu til að vera ósamkvæm eftir að samhengið er lengt, en frammistaðan í myndbandinu endurspeglar einmitt getu þess til að muna heildaruppbygginguna stöðugt.
Einnig er það hvernig það meðhöndlar villur. Þegar villuboð koma upp dvelur það ekki við yfirborðságiskunina um „líklega vandamál með einhverja kóðalínu“, heldur ákvarðar fyrst villutegundina, greinir á milli rökréttra vandamála, umhverfisvandamála eða ósjálfstæðisátaka og skipuleggur síðan villuleitarleiðina. Þetta er villuleit á stefnumótandi stigi, sem miðar að því að laga villuleitarleiðina.
Ef það er sameinað verkfærakalli verður þessi hæfileiki enn augljósari. Það gefur ekki bara skipanarábendingar, heldur sameinar einnig virka sendingu flugstöðvarinnar, greiningu logs, lagfæringu umhverfisins og heldur síðan áfram að ýta verkefninu áfram. Þessi hegðun er þegar farin að nálgast „sjálfkeyrandi“ verkfræðilega framvindu. Ef markmiðinu er ekki náð mun það halda áfram að endurtaka sig.
Skipuleggja fyrst og framkvæma síðan, viðhalda stöðugleika í uppbyggingu í löngum keðjum, leita að vandamálum á stefnumótandi hátt og halda áfram að ýta áfram í kringum markmiðið - það er samsetning fjögurra kjarnahæfileika sem kerfisverkfræði þarfnast, sem gerir GLM-5 kleift að byrja að sýna hegðunarmynstur sem nálgast vinnubrögð verkfræðings.
Hvers vegna getur GLM-5 tekið við keflinu af „arkitektinum“?
Ef raunprófun fyrsta hlutans sannaði að GLM-5 „getur unnið flókin störf“, þá er næsta spurning: Hvað gerir það kleift að gera það? Svarið liggur í öllu „verkfræðilegu hegðunarmynstri“ þess sem er falið á bak við framleiðsluna.
Lykilatriðið er að GLM-5 hefur greinilega kynnt sjálfskoðunarkerfi hugsunarkeðjunnar svipað Claude Opus 4.6.
Í raunverulegri notkun er hægt að finna fyrir því að það byrjar ekki strax að „fylla út kóða“ þegar það fær verkefni, heldur framkvæmir margar umferðir af rökréttri ályktun í bakgrunni: spáir fyrir um tengsl eininga, forðast virkan dauðalykkjuleiðir, uppgötvar auðlindarárekstra og jaðarskilyrði fyrirfram. Bein breyting sem þessi hegðun hefur í för með sér er - til að tryggja að áætlunin standist verkfræðilega, er hún tilbúin að hægja á sér og hugsa málið til enda.
Í flóknum verkefnum mun GLM-5 fyrst gefa skýra sundurliðun á einingum: hvaða undireiningar kerfið samanstendur af, hvað er inntak og úttak hverrar einingar, hvaða hlutar geta verið unnar samhliða og hvaða hlutar verða að vera unnar í röð. Síðan sigrar það þær ein af annarri, frekar en að skrifa og hugsa. Þetta gerir vinnubrögð þess líkari raunverulegum verkfræðingi: teikna fyrst arkitektúrrit og skrifa síðan útfærsluatriði. Það er greinilega tilfinning fyrir „seiglu til að hætta ekki fyrr en vandamálið er leyst alveg“, frekar en að ljúka yfirborðslega réttum hluta og ljúka því í flýti.
Þessi munur er sérstaklega áberandi í samanburði við hefðbundin kóðunarlíkön. Í fortíðinni, þegar mörg líkön lenda í villuboðum, renna þau hratt inn í kunnuglegt mynstur: biðjast afsökunar, endurtaka villuboðin, gefa óstaðfesta lagfæringartillögu; ef það mistekst aftur byrja þau að gefa út svipuð svör í lykkju. GLM-5 meðhöndlar það á þann hátt sem er líkari reyndum arkitekt. Í raunprófuninni, þegar verkefnið gat ekki keyrt vegna ósjálfstæðisvandamála í umhverfinu, dvaldi það ekki við yfirborðsvilluboðin, heldur greindi virkan ósjálfstæðistréð (Dependency Tree), ákvarðaði uppruna átakanna og stjórnaði OpenClaw frekar til að laga umhverfið.
Allt ferlið er meira eins og „sjálfkeyrandi“ dreifing: líkanið bregst ekki óvirkt, heldur les stöðugt logs, leiðréttir leiðir og staðfestir niðurstöður.
Annar hæfileiki sem er oft hunsaður en er afar mikilvægur í kerfisverkfræði er samhengissamfellanleiki.
Milljón Token glugginn GLM-5 gerir það kleift að skilja kóðauppbyggingu, breytingasögu, stillingarskrár og keyrslulogs alls verkefnisins í sama samhengi. Þetta þýðir að það getur þegar dæmt um hvaða einingar breyting mun hafa keðjuverkun á frá alþjóðlegu sjónarhorni. Í löngum verkefnakeðjum ákvarðar þessi hæfileiki beint hvort líkanið er „snjallt en skammsýnt“ eða „stöðugt og stjórnanlegt“.
Á heildina litið er það að GLM-5 tekur í raun við hlutverki „arkitektsins“ aðallega vegna þess að það byrjar að hugsa um vandamál eins og arkitekt: skipuleggja fyrst, framkvæma síðan; staðfesta stöðugt, leiðrétta stöðugt; einbeita sér að kerfinu í heild, frekar en að einum árangri.
Þetta er líka undirliggjandi ástæða þess að það getur lokið þeim kerfisbundnu raunprófunarverkefnum í fyrsta hlutanum.
03
**Opus í opnum hugbúnaði? **
Ef litið er á vistkerfi stórra líkana árið 2026, liggur gildi GLM-5 meira í því að það brýtur í bága við eitthvað sem áður var næstum sjálfgefið: greind á kerfisstigi virðist aðeins geta verið til í lokuðum líkönum.
Áður höfðu Claude Opus 4.6 og GPT-5.3 vissulega keyrt leiðina „Agentic Coding“ - líkanið leitast ekki lengur við tafarlaus viðbrögð, heldur lýkur raunverulega flóknum verkfræðilegum verkefnum með skipulagningu, sundurliðun og endurtekinni keyrslu. En kostnaðurinn er líka mjög hár: Token neysla fyrir mikil verkefni er afar há, og fullkomin kerfisbundin tilraun þýðir oft umtalsverðan kostnað við símtöl.
GLM-5 býður upp á aðra lausn hér. Sem opið líkan færir það „AI á kerfisarkitektastigi“ frá skýinu og reikningunum aftur í umhverfi þróunaraðilans. Þú getur dreift því á staðnum og látið það eyða tíma í að naga þessi óhreinu, erfiðu og stóru störf: stilla logs, athuga ósjálfstæði, breyta gömlum kóða, bæta við jaðarskilyrðum.
Þetta má líta á sem skipulagsbreytingu á hagkvæmni - greind á arkitektastigi er ekki lengur forréttindi fárra teyma.
Ef þú skilur þennan mun með atvinnulegri myndlíkingu verður hann leiðbeinandi. Líkön eins og Kimi 2.5 eru meira eins og framúrskarandi framendaverkfræðingar með fagurfræði á netinu og sterk samskipti, fær um að búa til One-shot, sjónræna framsetningu og hröð viðbrögð; en stíll GLM-5 er augljóslega öðruvísi, hann er meira eins og reyndur kerfisarkitekt sem heldur sig við botnlínuna og leggur áherslu á rökfræði: einbeitir sér að einingatengslum, óeðlilegum leiðum, viðhaldshæfni og langtíma stöðugum rekstri.
Á bak við þetta er í raun skýrt atvinnustig AI forritunar - frá því að sækjast eftir „að líta vel út“ Vibe Coding, til að leggja áherslu á styrkleika og verkfræðilega aga.
Það sem er mikilvægara er að tilkoma GLM-5 gerir hugmyndina um eins manns fyrirtæki framkvæmanlegri. Þegar þróunaraðili getur haft staðbundinn AI samstarfsaðila sem skilur kerfishönnun, getur keyrt til lengri tíma og getur leiðrétt sig sjálfur, þá byrja verkefni sem áður þurftu teymisstærð til að ljúka að þjappast saman innan sviðs einstaklingsstjórnunar. Næst hefur GLM-5 möguleika á að verða "stafrænn samstarfsaðili" sem ber ábyrgð á kjarnaverkfræðilegri útfærslu í einyrkjafyrirtæki.





