Açık Kaynak Dünyasının Opus Anı: GLM-5, Agentic Kodlamanın Bayrağını Devralabilecek mi?

Bir geliştiriciye yapay zeka programlamada en sinir bozucu anın ne olduğunu sorarsanız,

Muhtemelen size hata karşısında mekanik bir şekilde söylediği "Üzgünüm, yanlış anladım" cevabını ve ardından aynı hatalı kodu tekrar etmesini söyleyecektir.

Geçtiğimiz yıl, Kodlama Büyük Modellerindeki ilerleme, daha çok "üretim yeteneği"nde kendini gösterdi: tek cümleyle web sayfaları, bileşenler, küçük oyunlar oluşturma - 15 saniye içinde piksel tarzı bir web sayfası, havalı bir SVG ikonu veya çalışan bir yılan oyunu oluşturma. Bu demolar yeterince etkileyici, ancak aynı zamanda yeterince "hafif". Vibe Kodlama (atmosferik kodlama) çağında üretilen gelişmiş oyuncaklara benziyorlar. Ancak yüksek eş zamanlı mimariler, temel sürücü uyarlamaları veya karmaşık sistem yeniden yapılandırmaları söz konusu olduğunda, "seradaki çiçekler" haline geliyorlar.

Bu yüzden son zamanlarda Silikon Vadisi'ndeki rüzgar değişti.

İster Claude Opus 4.6 ister GPT-5.3 olsun, bu üst düzey büyük modeller Agentic Kodlamayı vurgulamaya başladı: "saniyeler içinde sonuç çıkarma"yı hedeflemek yerine, planlama, parçalara ayırma ve tekrar tekrar çalıştırma yoluyla sistem düzeyinde görevleri tamamlamak.

"Ön uç estetiği"nden "sistem mühendisliği"ne doğru bu paradigma kayması, daha önce kapalı kaynak devlerinin tekel alanı olarak kabul ediliyordu. GLM-5'i test edene kadar, açık kaynak topluluğunun "mimar çağı"nın erkenden başladığını fark etmedim.

"Ön Uç"tan "Sistem Mühendisliği"ne

Daha önce AI Kodlamadan bahsederken, çoğu zaman tanıdık bir anlatı akla geliyordu - tek cümleyle web sayfası oluşturma, bir dakikada küçük bir oyun yapma, on saniyede havalı bir hareketli efekt oluşturma. Bunlar "görsel zevk"i vurguluyor: düğmeler hareket ediyor, sayfa güzel görünüyor, efektler zengin.

Ancak şantiyeye gerçekten girenler bilir ki, bir demo oluşturmak bir sistemi desteklemek anlamına gelmez.

Karmaşık görevlerin zorluğu, "kod yazmak"ta değil, modüllerin nasıl ayrılacağında, durumun nasıl yönetileceğinde, istisnaların nasıl ele alınacağında, performansın nasıl optimize edileceğinde ve sistem karmaşıklaşmaya başladığında yapının hala istikrarlı kalıp kalamayacağındadır.

Bu da karmaşık görevleri test nesnesi olarak seçmemizin nedeni.

GLM-5'in konumlandırması, birçok rakibinden farklı.

Çoğu model "mükemmel ön uç" gibi - etkileşimli arayüzler ve görsel efektler oluşturmada yetenekli - ise, GLM-5 daha çok "sistem mühendisliği rolü"ne benziyor. Çok modüllü işbirliğini, uzun zincirli görevleri ve üretim ortamında çalıştırılabilir yapısal istikrarı vurguluyor.

Bunu doğrulamak için, tamamen farklı boyutlarda iki gerçek test senaryosu tasarladık.

İlk test, görünüşte kolay ama aslında son derece sistematik bir görev - bir tarayıcı ve kamera kullanarak, "AI görsel havada havai fişek kontrolü" temalı bir Bahar Şenliği etkileşimli oyunu oluşturmak.

Gerçek test videosunda görülebileceği gibi, kullanıcı kamera önünde duruyor ve el hareketleriyle havai fişeklerin fırlatma yönünü ve ritmini kontrol ediyor; havai fişekler havada açılıyor, parçacık efektleri ve dinamik ışık efektleri geri bildirimi eşliğinde, genel etkileşim akıcı ve doğal.

Ancak bu basit bir ön uç hareketli efekt projesi değil. En azından aşağıdaki birkaç temel modülü içeriyor: el hareketi tanıma ve görsel girdi işleme; el hareketi koordinatlarının fırlatma mantığına eşlenmesi; havai fişek parçacık sistemi ve açılma efektleri; gerçek zamanlı render ve kare hızı kontrolü; tarayıcı uyumluluğu ve kamera izin istisna işleme; etkileşim durumu yönetimi ve kullanıcı geri bildirimi mekanizması.

Tamamen yapılandırılmış, akıcı bir etkileşimli sistem olduğu söylenebilir. Gerçek test sürecinden görülebileceği gibi, GLM-5 doğrudan kodlamaya girmek yerine, önce genel mimariyi planladı: görsel girdi modülü, kontrol mantığı katmanı, render katmanı, efekt katmanı nasıl ayrılacak; veri akışı nasıl aktarılacak; hangi kısımlar performans darboğazı haline gelebilir.

Ardından, el hareketi tanımadan veri işlemeyle başlayarak, fırlatma yörüngesi hesaplamasına ve ardından parçacık patlama efektlerinin parametre optimizasyonuna kadar mantığı katman katman uyguladı.

Render takıldığında, parçacık sayısını azaltmayı ve döngü yapısını optimize etmeyi proaktif olarak önerdi; el hareketi tanıma yanlış olduğunda, eşik ve filtreleme stratejilerini ayarladı.

Videoda sunulan efekt, "çok doğal görünen bir etkileşim". Ancak bunun arkasında eksiksiz bir mühendislik zinciri yatıyor: planlama → yazma → hata ayıklama → performans optimizasyonu → etkileşim düzeltmesi.

Sonuç olarak oluşturulan kod doğrudan çalıştırılabilir, etkileşim kararlı, kare hızı düzgün ve istisnalar ele alınabilir. Daha da önemlisi, çalışma şekli net bir sistem düşüncesi sunuyor: modül sınırları açık, mantıksal katmanlama makul, tüm işlevleri tek bir dosyada yığmak yerine.

İkinci örnek test edilen, yapısal sistem yeteneği. Bu senaryo, medya çalışmalarında günlük olarak karşılaşılan bir durum - bir röportaj stenogramını içe aktarma, içeriği özetleme, konu başlıkları ve fikirler oluşturma.

Gerçek testte görülebileceği gibi, işlem akışı çok basit: Bir süre önce aldığım bir röportaj stenogramını yapıştırdım, model analiz etmeye başladı ve ardından içerik özetini ve konu başlıklarını oluşturdu. Sonuçlardan görülebileceği gibi, oluşturduğu konu başlıkları oldukça uygulanabilir.

Görsel etkileşim sistemleriyle karşılaştırıldığında, ses kaydı düzenleme basit görünse de, aslında modelin "yapısal soyutlama yeteneği"ni test ediyor. Gerçek bir röportaj kaydı genellikle son derece yapılandırılmamıştır: görüşler atlar, bilgiler tekrarlanır, ana hatlar ve yan hatlar iç içe geçer. Bu nedenle, bu örnekte GLM-5'in sergilediği yetenek, sistem düzeyindedir.

İlk olarak, tema tanıma ve ana hat çıkarma yeteneği. Model, özeti orijinal metin sırasına göre oluşturmak yerine, önce temel konunun ne olduğuna karar verir ve ardından içeriği bu konu etrafında yeniden düzenler. Bu, dahili olarak bir tarama tamamladığı, hangi bilgilerin ana hatta ait olduğunu, hangilerinin ek veya gürültü olduğunu belirlediği anlamına gelir. Bu yetenek esasen bir planlama yeteneğidir, yani çıktı vermeden önce soyut bir yapısal çerçeve oluşturmak.

İkincisi, modüler yeniden düzenleme yeteneği. Farklı paragraflarda dağılmış ilgili görüşleri aynı modülde sınıflandırır. Bu çapraz paragraf entegrasyon yeteneği, modelin uzun metinleri işlerken küresel tutarlılığa sahip olduğunu gösterir.

Üçüncüsü, mantıksal sırayı proaktif olarak ayarlama yeteneği. Gerçek çıktı taslağı genellikle orijinal kayıt sırasından farklıdır. GLM-5'in neden-sonuç ilişkisine veya argüman mantığına göre katmanları yeniden düzenlediği görülebilir. Bu, "mantığın orijinal girdi sırasından öncelikli olduğu" bir yargıyı yansıtır. Bu "önce yapı, sonra çıktı" modeli, sistem mühendisliği düşüncesinin özüdür.

Bu iki örnek, biri gerçek zamanlı görsel etkileşim sistemi, diğeri medya bilgi yapılandırma sistemi, görünüşte tamamen farklı. Ancak aynı şeyi doğruluyorlar - GLM-5 eksiksiz bir görev döngüsü yeteneğine sahip: planlama → uygulama → hata ayıklama → optimizasyon.

Havai fişek oyununda bu, modül katmanlaması, performans optimizasyonu ve istisna işlemeyle kendini gösterir; ses kayıt işlemcisinde bu, tema yargısı, yapısal ayrıştırma ve mantıksal yeniden düzenlemeyle kendini gösterir. Ortak noktaları, modelin "sonuç üretmek"le sınırlı kalmaması, sürdürülebilir bir evrimleşen yapıyı korumasıdır.

Nispeten karmaşık bir görev olan "minimal bir işletim sistemi çekirdeği oluşturma"yı denemeye devam ettim. Bu gerçek testte, videodaki kodun sonunda çalışmasından ziyade, GLM-5'in tüm süreç boyunca sergilediği davranış biçimi dikkat çekicidir.

Bir görev alır almaz hemen üretim durumuna geçmek yerine, önce görev sınırlarını netleştirdi, modülleri proaktif olarak ayırdı, sistem yapısını planladı ve ardından uygulama aşamasına girdi. Bu "önce yapı" yolu, esasen daha önce bahsedilen mühendislik düşüncesidir - önce sistemin nasıl oluştuğunu tanımlamak, sonra belirli uygulama ayrıntılarını tartışmak, yazarken bir araya getirmek yerine.

Çok turlu yazma, çalıştırma, hata verme, düzeltme döngüsünde, GLM-5'te yapısal bir çökme de olmadı. Her değişiklik, önceden belirlenmiş mimari etrafında yapıldı, yeniden başlamak veya yerel yamalar yapmak yerine. Bu, dahili olarak eksiksiz bir sistem modelini koruduğunu ve uzun zincirli görevlerde tutarlılığı koruyabildiğini gösterir. Birçok model, bağlam uzadıkça çelişkili hale gelme eğilimindedir, ancak videodaki performans tam olarak genel yapıya sürekli hafıza yeteneğini yansıtır.

Bir de hataları ele alma şekli var. Bir hata oluştuğunda, "belirli bir satır kod sorunu olabilir" şeklindeki yüzeysel tahminlerde kalmak yerine, önce hata türünü belirledi, mantıksal sorunları, ortam sorunlarını veya bağımlılık çakışmalarını ayırt etti ve ardından sorun giderme yolunu planladı. Bu, sorun yolunu düzeltmeyi amaçlayan stratejik düzeyde bir hata ayıklamadır.

Araç çağrısıyla birlikte ele alınırsa, bu yetenek daha belirgin hale gelecektir. Sadece komut önerileri vermekle kalmıyor, aynı zamanda terminal yürütmeyi proaktif olarak planlıyor, günlükleri analiz ediyor, ortamı onarıyor ve ardından görevi ilerletmeye devam ediyor. Bu davranış, "otomatik pilot" tarzı bir mühendislik ilerlemesine benziyor. Hedef tamamlanana kadar sürekli olarak yineleme yapıyor.

Önce planlama sonra uygulama, uzun zincirde yapıyı istikrarlı tutma, sorunları stratejik bir şekilde giderme ve hedef etrafında sürekli ilerleme - sistem mühendisliğinin ihtiyaç duyduğu dört temel yeteneğin üst üste gelmesi, GLM-5'in bir mühendisin çalışma şekline yakın bir davranış modeli sergilemesini sağlıyor.

GLM-5 Neden "Mimar"ın Bayrağını Devralabiliyor?

İlk bölümdeki gerçek test GLM-5'in "karmaşık işler yapabileceğini" kanıtladıysa, o zaman sonraki soru şu: Bunu neye borçlu? Cevap, çıktının arkasına gizlenmiş eksiksiz bir "mühendislik düzeyinde davranış modeli"nde yatıyor.

Kilit nokta, GLM-5'in Claude Opus 4.6'ya benzer bir düşünce zinciri öz denetim mekanizması getirmiş olmasıdır.

Gerçek kullanımda hissedilebileceği gibi, bir görev alır almaz hemen "kod doldurmaya" başlamıyor, bunun yerine arka planda çok turlu mantıksal çıkarımlar yapıyor: modüller arasındaki bağlantı ilişkilerini önceden tahmin ediyor, sonsuz döngü yollarından proaktif olarak kaçınıyor, kaynak çakışmalarını ve sınır koşullarını önceden keşfediyor. Bu davranışın getirdiği doğrudan değişiklik şu ki - çözümün mühendislik açısından sağlam olduğundan emin olmak için, yavaşlamaya ve sorunu tam olarak düşünmeye istekli.

Karmaşık görevlerde, GLM-5 önce net bir modül ayrıştırması sunacaktır: sistem hangi alt modüllerden oluşuyor, her modülün girdisi ve çıktısı ne, hangi kısımlar paralel olarak ilerletilebilir, hangileri seri olarak tamamlanmalıdır. Ardından, yazarken düşünmek yerine, bunları tek tek ele alacaktır. Bu, çalışma şeklini gerçek bir mühendise daha çok benzetiyor: önce mimari diyagramı çizmek, sonra uygulama ayrıntılarını yazmak. Sorunu tamamen çözmeden durmaya istekli olmadığına dair bir "azmi" olduğu açıkça hissediliyor, doğru görünen bir bölümü tamamlayıp aceleyle bitirmek yerine.

Bu fark, geleneksel Kodlama modelleriyle karşılaştırıldığında özellikle belirgindir. Geçmişte birçok model bir hatayla karşılaştığında, hızla tanıdık bir moda kayıyordu: özür dilemek, hata bilgilerini tekrar etmek, doğrulanmamış bir düzeltme önerisi sunmak; tekrar başarısız olursa, yaklaşık cevaplar vermeye başlıyordu. GLM-5'in ele alma şekli ise eski mimarlara daha yakın. Gerçek testte, proje ortam bağımlılıkları nedeniyle çalıştırılamadığında, yüzeysel hata bilgilerinde kalmak yerine, bağımlılık ağacını (Dependency Tree) proaktif olarak analiz etti, çakışma kaynağını belirledi ve ardından OpenClaw'a ortamı onarması için talimat verdi.

Tüm süreç daha çok "otomatik pilot" tarzı bir dağıtıma benziyor: model pasif olarak yanıt vermek yerine, günlükleri sürekli olarak okuyor, yolları düzeltiyor, sonuçları doğruluyor.

Sıkça göz ardı edilen, ancak sistem mühendisliğinde son derece önemli olan bir diğer yetenek ise bağlam bütünlüğüdür.

GLM-5'in milyon seviyesindeki Token penceresi, tüm proje kod yapısını, geçmiş değişiklikleri, yapılandırma dosyalarını ve çalışma günlüklerini aynı bağlamda anlamasını sağlıyor. Bu, bir değişikliğin hangi modüllerde zincirleme reaksiyonlara neden olacağını küresel bir bakış açısıyla yargılayabileceği anlamına geliyor. Uzun zincirli görevlerde, bu yetenek doğrudan modelin "akıllı ama kısa görüşlü" mü yoksa "sağlam ve kontrol edilebilir" mi olduğuna karar veriyor.

Genel olarak, GLM-5'in "mimar" rolünü gerçekten devralmasının ana nedeni, bir mimar gibi sorunları düşünmeye başlamasıdır: önce planlama, sonra uygulama; sürekli doğrulama, sürekli düzeltme; tek bir noktada başarıdan ziyade sistemin tamamına odaklanma.

Bu da ilk bölümde bahsedilen sistem düzeyindeki gerçek test görevlerini tamamlayabilmesinin temel nedeni.

Açık Kaynak Dünyasının Opus'u mu?

2026'nın büyük model ekosistemine bakıldığında, GLM-5'in değeri daha çok daha önce neredeyse varsayılan olarak kabul edilen bir şeyi kırmasında yatıyor: sistem düzeyinde zeka, yalnızca kapalı kaynak modellerde var olabilir gibi görünüyordu.

Daha önce, Claude Opus 4.6 ve GPT-5.3 gerçekten de "Agentic Kodlama" yolunu açmıştı - modeller artık anında geri bildirim aramıyor, bunun yerine planlama, parçalara ayırma ve tekrar tekrar çalıştırma yoluyla gerçekten karmaşık mühendislik görevlerini tamamlıyor. Ancak bunun bedeli de yüksek: yüksek yoğunluklu görevlerin Token tüketimi son derece yüksek, eksiksiz bir sistem düzeyinde deneme genellikle önemli bir çağrı maliyeti anlamına geliyor.

GLM-5 burada farklı bir çözüm sunuyor. Açık kaynak bir model olarak, "sistem mimarı düzeyinde AI"yı buluttan ve faturalardan geliştiricilerin kendi ortamlarına geri getiriyor. Yerel olarak dağıtabilir, kirli, yorucu ve büyük işleri halletmesi için ona zaman tanıyabilirsiniz: günlükleri ayarlama, bağımlılıkları kontrol etme, eski kodları değiştirme, sınır koşullarını tamamlama.

Bu, maliyet etkinliğinde yapısal bir değişiklik olarak görülebilir - mimar düzeyinde zeka artık az sayıda ekibin ayrıcalığı değil.

Bu farkı mesleki bir metaforla anlamak daha sezgisel olacaktır. Kimi 2.5 gibi modeller, estetik açıdan yerinde ve etkileşim duygusu son derece güçlü olan mükemmel ön uç mühendislerine daha çok benziyor, tek seferlik üretim, görsel sunum ve hızlı geri bildirim konusunda yetenekli; GLM-5'in tarzı ise belirgin şekilde farklı, daha çok sınırları koruyan, mantığa önem veren deneyimli bir sistem mimarına benziyor: modül ilişkilerine, istisna yollarına, sürdürülebilirliğe ve uzun vadeli istikrarlı çalışmaya odaklanıyor.

Bunun arkasında aslında programlama AI'sının net bir mesleki ilerlemesi yatıyor - "çok havalı görünen" Vibe Kodlamayı takip etmekten, sağlamlığı ve mühendislik disiplinini vurgulayan Mühendisliğe doğru.

Daha da önemlisi, GLM-5'in ortaya çıkışı, tek kişilik şirket kavramını daha uygulanabilir hale getiriyor.Bir geliştirici, sistem tasarımını anlayan, uzun süre çalışabilen ve kendini düzeltebilen bir yapay zeka ortağına yerel olarak sahip olduğunda, başlangıçta ekip ölçeği gerektiren birçok mühendislik çalışması, bireysel olarak kontrol edilebilir bir aralığa sıkıştırılmaya başlar. Gelecekte GLM-5, tek kişilik bir şirketteki temel mühendislik uygulamasından sorumlu "dijital ortak" olma potansiyeline sahiptir.

Açık Kaynak Dünyasının Opus Anı: GLM-5, Agentic Kodlamanın Bayrağını Devralabilecek mi?

You Might Also Like

Claude Code Buddy Değiştirme Kılavuzu: Parlak Efsanevi Evcil Hayvan Nasıl Elde Edilir

Obsidian Defuddle'ı Tanıttı, Obsidian Web Clipper'ı Yeni Bir Seviyeye Taşıdı

OpenAI aniden "üçü bir arada" duyurdu: Tarayıcı + Programlama + ChatGPT birleşti, içten içe geçen yılın yanlış olduğunu kabul etti

2026, kendini daha fazla "disiplin" etme! Bu 8 küçük şeyi yap, sağlık kendiliğinden gelir

O Kilo Vermek İçin Çaba Gösteren Ama Başaramayan Anneler, Kesinlikle Burada Takılıyorlar

AI Tarayıcı 24 Saat Stabil Çalışma Rehberi