Arquitectura de quatre agents de Grok 4.2: un avenç o una regressió?

★ xAI ha publicat la versió beta pública de Grok 4.2. El canvi principal: passar d'un model únic a un sistema de col·laboració de quatre agents.

Això no és una actualització gradual. És una reescriptura de l'arquitectura.

Arquitectura de quatre agents

Grok 4.2 ja no és un model que respon a preguntes. Són quatre "agents" que primer debaten internament i després et donen la resposta:

Grok (capità): coordina l'estratègia i la sortida integral
Harper: proporciona informació en temps real a través del flux de dades en temps real de X
Benjamin: garanteix el rigor lògic
Quart agent: responsable de la creativitat i el pensament divergent

"Grok 4.20 evolves from a single model into a native four-agent council, executing a production-grade collaboration on every complex query." — @MU_sings

Això sona genial. La pregunta és: funciona bé?

La polarització del feedback dels usuaris

Aquesta és la part més interessant de Grok 4.2: les avaluacions dels usuaris mostren una polarització extrema.

Avaluacions positives:

"The new Grok 4.2 seems to be based and unbiased at last." — @realbeandog

"Grok is the only AI to emphatically say 'No'" when asked 'Is the US on stolen land?' — @KatieMiller

Aquesta és la posició diferenciada de Grok: no intenta ser "neutral". Té una inclinació de posició clara; en paraules dels seus partidaris, això s'anomena "based".

Avaluacions negatives:

"Grok 4.2 Review: 4x slower, 4x dumber. This is a massive step backward and everyone involved needs to be ashamed." — @JuanSanchez0x0

"grok 4.2 doesnt seem that great" — @nicdunz

La crítica principal és: el mecanisme de debat de quatre agents fa que la resposta sigui més lenta i la qualitat de la resposta final no millora. Quan quatre IA primer discuteixen entre elles i després et donen una resposta, esperes més temps, però no necessàriament obtens un resultat millor.

Aquest és un problema de disseny fonamental: una arquitectura complexa no equival a una millor sortida.

La promesa d'un "aprenentatge ràpid"

Declaració d'Elon Musk:

"Grok 4.2 is expected to be about an order of magnitude smarter and faster than the current Grok 4 once its public beta wraps up next month."

La paraula clau és "once its public beta wraps up" (un cop finalitzi la seva beta pública). La versió actual és una prova beta pública i la versió final tindrà un augment d'ordre de magnitud.

Aquesta és una estratègia intel·ligent de gestió d'expectatives: primer llançar una versió controvertida, prometre que millorarà en el futur i, al mateix temps, recopilar feedback dels usuaris per iterar ràpidament.

El compte oficial de xAI també ho va destacar:

"Unlike prior versions of Grok, 4.2 is able to learn rapidly, so there will be improvements every week with release notes."

Actualitzacions setmanals. Aquesta és una transició d'un model estàtic a un sistema d'aprenentatge continu.

Comparació amb la competència

A les proves de referència, la sèrie Grok té els seus propis avantatges:

"Grok 4 is still state-of-the-art on ARC-AGI-2 among frontier models. 15.9% for Grok 4 vs 9.9% for GPT-5." — François CholletARC-AGI-2 és una prova de raonament abstracte dissenyada per François Chollet, considerada un indicador important de la capacitat de generalització de la IA. Grok 4 destaca en aquesta prova.

Però les proves de referència i l'ús diari són dues coses diferents.

Un desenvolupador va compartir el seu flux de treball:

"I saw a guy coding today. Tab 1 ChatGPT. Tab 2 Gemini. Tab 3 Claude. Tab 4 Grok. Tab 5 DeepSeek. He asked every AI the same question, patiently waited, then pasted each response into 5 different Python files. Hit run on all five. Pick the best one." — @Adidotdev

Aquesta és la realitat actual del mercat de la IA: no hi ha un rei absolut. Els desenvolupadors utilitzen diversos models simultàniament, cadascun aprofitant els seus avantatges.

Barrera de subscripció

Accés a Grok 4.2:

"Requires Premium+ or SuperGrok subscription." — @grok

Això no és gratuït. Per utilitzar l'última versió de Grok a X, cal pagar una subscripció. Això posiciona Grok com un producte de gamma alta, però també limita la seva base d'usuaris.

Comparació amb altres IA:

ChatGPT: la versió gratuïta utilitza GPT-4o, els usuaris de Plus tenen funcions més avançades
Claude: la versió gratuïta utilitza Sonnet, els usuaris de Pro tenen Opus
Grok: cal Premium+ per utilitzar l'última versió

Aquesta és una estratègia de diferenciació: Grok no busca el màxim nombre d'usuaris, sinó un grup específic d'usuaris: aquells que estan disposats a pagar per una posició "based" i dades en temps real de X.

El preu de ser "Based"

Un dels principals punts de venda de Grok és la seva "incorrecció política", o, més aviat, que no realitza una alineació de seguretat tan estricta com altres IA.

"Grok is the only AI to emphatically say 'No'" to certain politically sensitive questions.

Això planteja dos problemes:

Aquesta resposta "basada en fets" és realment un fet? O simplement s'adapta als prejudicis d'un grup específic d'usuaris?
Quan la IA té una posició clara, com és de fiable? La neutralitat no és perfecta, però la parcialitat explícita també és problemàtica.

Aquest no és un problema tècnic, sinó un problema de filosofia de disseny de producte. xAI ha triat una ruta de diferenciació: no fer una IA "segura però avorrida", sinó una IA "amb actitud però potencialment problemàtica".

El significat de l'arquitectura multi-agent

Deixant de banda la posició política de Grok, l'arquitectura de quatre agents en si mateixa mereix una discussió seriosa.

Els sistemes multi-agent no són un concepte nou en la investigació de la IA. La idea central és: deixar que diversos "experts" especialitzats col·laborin, és més eficaç que un model universal.

En teoria, això resol diversos problemes:

Professionalitat: cada agent es pot centrar en un tipus específic de tasca
Validació creuada: diversos agents poden comprovar els errors mútuament
Robustesa: un error d'un agent no provoca una fallada general

Però a la pràctica, introdueix nous problemes:

Latència: els quatre agents han de processar, triga més temps
Costos de coordinació: com fer que els quatre agents col·laborin de manera eficaç és un problema sense resoldre
Dificultat de depuració: quan el resultat no és bo, és difícil saber quin pas ha fallat

Les primeres opinions sobre Grok 4.2 indiquen que aquests problemes encara no s'han resolt bé.

Experiment borsari

Un experiment interessant:

"We gave a bunch of AIs $100K in the stock market to see if they could beat the S&P 500. So far Grok 4 is up 3.7% during the time of the test beating the S&P 500's +2.4% return." — @ralliesaiAquest experiment encara està en curs, i és massa aviat per treure conclusions. Però mostra un escenari d'ús: la IA com a eina d'assistència per a la presa de decisions d'inversió.

The Bottom Line

Grok 4.2 és una actualització controvertida.

L'arquitectura multi-agent és un experiment audaç, però els comentaris inicials dels usuaris suggereixen que hi ha problemes amb l'execució. S'ha tornat més ràpid i més complex, però complex no és sinònim de millor.

El posicionament "Based" és una estratègia de diferenciació, però també significa que Grok serveix a un grup específic d'usuaris, no a tothom.

El més destacable és la promesa d'xAI d'"actualitzacions setmanals". Si els errors de l'arquitectura de quatre agents es poden solucionar ràpidament, si la velocitat de resposta es pot millorar significativament, si es pot complir la promesa de ser "un ordre de magnitud més intel·ligent", llavors Grok 4.2 podria marcar una nova direcció en el disseny de productes d'IA.

Però ara? S'assembla més a una versió d'accés anticipat que a un producte madur.

Aquest article està basat en una anàlisi de 100 discussions sobre el llançament de Grok 4.2 a X/Twitter el 18 de febrer de 2026.

Arquitectura de quatre agents de Grok 4.2: un avenç o una regressió?

Arquitectura de quatre agents de Grok 4.2: un avenç o una regressió?