Архитектурата со четири агенти на Grok 4.2: Пробив или чекор назад?

★ xAI ја објави јавната бета верзија на Grok 4.2. Главна промена: од еден модел во систем за соработка со четири агенти.

Ова не е постепено ажурирање. Ова е препишување на архитектурата.

Архитектура со четири агенти

Grok 4.2 повеќе не е еден модел кој одговара на прашања. Тоа се четири „агенти“ кои прво дебатираат внатрешно, а потоа ви даваат одговор:

Grok (капетан): Координира стратегија и сеопфатен излез
Harper: Обезбедува информации во реално време преку стриминг на податоци во реално време од X
Benjamin: Обезбедува логичка строгост
Четврти агент: Одговорен за креативност и дивергентно размислување

„Grok 4.20 еволуира од еден модел во матичен совет со четири агенти, извршувајќи соработка од производствен степен на секое комплексно барање.“ — @MU_sings

Ова звучи кул. Прашањето е: дали функционира?

Поларизација на повратните информации од корисниците

Ова е најинтересниот дел од Grok 4.2 - оценките на корисниците покажуваат екстремна поларизација.

Позитивни оценки:

„Се чини дека новиот Grok 4.2 е конечно базиран и непристрасен.“ — @realbeandog

„Grok е единствената вештачка интелигенција која категорично вели „Не“ кога ќе ја прашате „Дали САД се на украдена земја?“ — @KatieMiller

Ова е диференцирачка позиција на Grok: не се обидува да биде „неутрален“. Има јасна позиција - според поддржувачите, ова се нарекува „базирано“.

Негативни оценки:

„Преглед на Grok 4.2: 4x поспоро, 4x поглупаво. Ова е огромен чекор назад и сите вклучени треба да се срамат.“ — @JuanSanchez0x0

„grok 4.2 не изгледа толку одлично“ — @nicdunz

Јадрото на критиката е: механизмот за дебата со четири агенти доведува до побавен одговор, а квалитетот на конечниот одговор не е подобрен. Кога четири вештачки интелигенции прво дискутираат меѓу себе, а потоа ви даваат одговор, чекате подолго, но резултатот не е нужно подобар.

Ова е фундаментален проблем со дизајнот: комплексната архитектура не е еднаква на подобар излез.

Ветување за „брзо учење“

Изјава на Elon Musk:

„Се очекува Grok 4.2 да биде за еден ред на големина попаметен и побрз од сегашниот Grok 4 откако ќе заврши неговата јавна бета верзија следниот месец.“

Клучниот збор е „откако ќе заврши неговата јавна бета верзија“. Сегашната верзија е јавна бета, а финалната верзија ќе има подобрување за еден ред на големина.

Ова е паметна стратегија за управување со очекувањата: прво објавете контроверзна верзија, ветете дека ќе биде подобро во иднина и истовремено собирајте повратни информации од корисниците за брза итерација.

Официјалниот профил на xAI исто така го нагласи ова:

„За разлика од претходните верзии на Grok, 4.2 е способен брзо да учи, така што ќе има подобрувања секоја недела со белешки за изданието.“

Неделни ажурирања. Ова е транзиција од статичен модел во систем за континуирано учење.

Споредба со конкурентите

Во бенчмарк тестовите, серијата Grok има свои предности:

„Grok 4 сè уште е најсовремен на ARC-AGI-2 меѓу граничните модели. 15,9% за Grok 4 наспроти 9,9% за GPT-5.“ — François Chollet ARC-AGI-2 е тест за апстрактно расудување дизајниран од François Chollet, кој се смета за важен индикатор за мерење на способноста за генерализација на вештачката интелигенција. Grok 4 е водечки на овој тест.

Но, тестирањето и секојдневната употреба се две различни работи.

Еден развивач го сподели својот работен процес:

"I saw a guy coding today. Tab 1 ChatGPT. Tab 2 Gemini. Tab 3 Claude. Tab 4 Grok. Tab 5 DeepSeek. He asked every AI the same question, patiently waited, then pasted each response into 5 different Python files. Hit run on all five. Pick the best one." — @Adidotdev

Ова е реалноста на пазарот на вештачката интелигенција денес: нема апсолутен крал. Развивачите користат повеќе модели истовремено, секој со свои предности.

Праг за претплата

Пристап до Grok 4.2:

"Requires Premium+ or SuperGrok subscription." — @grok

Ова не е бесплатно. За да го користите најновиот Grok на X, треба да платите претплата. Ова го позиционира Grok како врвен производ, но исто така ја ограничува неговата корисничка база.

Споредба со други вештачки интелигенции:

ChatGPT: бесплатната верзија го користи GPT-4o, Plus корисниците имаат пристап до понапредни функции
Claude: бесплатната верзија го користи Sonnet, Pro корисниците имаат пристап до Opus
Grok: потребна е Premium+ за да се користи најновата верзија

Ова е стратегија за диференцијација: Grok не се стреми кон максимален број корисници, туку кон специфична група корисници - оние кои се подготвени да платат за "based" став и податоци во реално време од X.

Цената на "Based"

Една од главните продажни точки на Grok е неговата "политичка некоректност" - или, тоа што не е толку строго усогласен со безбедносните стандарди како другите вештачки интелигенции.

"Grok is the only AI to emphatically say 'No'" to certain politically sensitive questions.

Ова повлекува два проблема:

Дали овој "заснован на факти" одговор е навистина факт? Или само ги задоволува предрасудите на одредена група корисници?
Колку е сигурна вештачката интелигенција кога има јасен став? Неутралноста не е совршена, но јасната пристрасност исто така претставува проблем.

Ова не е технички проблем, туку филозофија на дизајн на производ. xAI избра диференциран пат - да не прави "безбедна, но здодевна" вештачка интелигенција, туку "вештачка интелигенција со став, но потенцијално проблематична".

Значењето на архитектурата со повеќе агенти

Настрана од политичкиот став на Grok, архитектурата со четири агенти сама по себе заслужува сериозна дискусија.

Системите со повеќе агенти не се нов концепт во истражувањето на вештачката интелигенција. Основната идеја е: да се дозволи на повеќе специјализирани "експерти" да соработуваат, што е поефикасно од еден универзален модел.

Теоретски, ова решава неколку проблеми:

Специјализација: секој агент може да се фокусира на специфичен тип на задача
Вкрстена валидација: повеќе агенти можат меѓусебно да ги проверуваат грешките
Робусност: грешка на еден агент не доведува до целосен неуспех

Но, во пракса, ова воведува нови проблеми:

Латентност: треба да се обработат четири агенти, што трае подолго
Трошоци за координација: како да се направи ефективна соработка на четири агенти е нерешен проблем
Тешкотии при дебагирање: кога резултатот не е добар, тешко е да се знае кој дел од процесот е проблематичен

Раните повратни информации за Grok 4.2 покажуваат дека овие проблеми сè уште не се добро решени.

Експеримент на берзата

Интересен експеримент:

"We gave a bunch of AIs $100K in the stock market to see if they could beat the S&P 500. So far Grok 4 is up 3.7% during the time of the test beating the S&P 500's +2.4% return." — @ralliesaiОвој експеримент е сè уште во тек, и прерано е за заклучоци. Но, тој демонстрира сценарио за употреба: вештачката интелигенција како помошна алатка за инвестициски одлуки.

Заклучок

Grok 4.2 е контроверзно ажурирање.

Архитектурата со повеќе агенти е смел експеримент, но раните повратни информации од корисниците покажуваат дека има проблеми со имплементацијата. Таа побрзо станува посложена, но сложеноста не е еднаква на подобро.

Позиционирањето како "Based" е стратегија за диференцијација, но исто така значи дека Grok служи на специфична група корисници, а не на сите.

Најзначајно е ветувањето на xAI за "неделни ажурирања". Ако грешките во архитектурата со четири агенти можат брзо да се поправат, ако брзината на одговор може значително да се подобри, ако ветувањето за "еден степен на големина попаметно" може да се исполни - тогаш Grok 4.2 може да означи нова насока во дизајнот на производи со вештачка интелигенција.

Но, сега? Тоа повеќе личи на верзија за ран пристап отколку на зрел производ.

Овој текст е напишан врз основа на анализа на 100 дискусии на X/Twitter за објавувањето на Grok 4.2 на 18 февруари 2026 година.