Evolucija RAG-a: Od proširenja dohvaćanjem do zaključivanja pomoću agenata
Do 2026. godine, RAG (Retrieval-Augmented Generation - Generiranje prošireno dohvaćanjem) evoluirao je od "dodavanja okvira za pretraživanje LLM-u" u potpuni sustav agenata.
Od dohvaćanja do zaključivanja
Netko je na X-u istaknuo ključnu promjenu:
"Izgradnja AI agenta koji može zaključivati o pretraživanju - a ne samo dohvaćati - informacije."
Ovo je ključna razlika RAG 2.0. Tradicionalni RAG je dvostupanjski proces "dohvaćanje → generiranje". Nova paradigma je ciklus agenta "dohvaćanje → zaključivanje → djelovanje".
Agent ne ubacuje rezultate pretraživanja u prompt, već razumije namjeru pretraživanja, procjenjuje kvalitetu informacija i odlučuje treba li više dohvaćanja. Ovo je nadogradnja od "korisnika alata" do "istraživača".
Vector Search 2.0
Netko je na X-u podijelio najnoviji napredak:
"Prikaz kako se s novim Vector Search 2.0 i ADK može izgraditi osnovni Agentic RAG sustav u otprilike 10 minuta."
Vektorsko pretraživanje više nije jednostavno podudaranje sličnosti. Nova verzija podržava:
- Hibridno dohvaćanje (vektori + ključne riječi)
- Višestruko zaključivanje (jedno dohvaćanje pokreće drugo)
- Dinamičko preuređivanje (prilagođavanje rezultata na temelju konteksta)
Ovo omogućuje RAG-u da evoluira od "pronalaženja relevantnih dokumenata" do "izgradnje putova znanja".
LLM aplikacije spremne za produkciju
Netko je na X-u sastavio popis:
"Zbirka svih LLM aplikacija spremnih za produkciju u 2026. godini. awesome-llm-apps sadrži kod koji se može izravno kopirati i zalijepiti za RAG, Agente, multimodalne aplikacije i AI SaaS proizvode."
Ovo odražava zrelost industrije: od "eksperimenta" do "šablonizacije". Kada se RAG aplikacije mogu kopirati i zalijepiti, diferencijacija više nije sama tehnologija, već kvaliteta podataka i razumijevanje poslovanja.
100+ LLM alata
Netko je na X-u sastavio:
"LLM inženjerski alat: odabrani popis 100+ LLM biblioteka i okvira za obuku, fino podešavanje, izgradnju, procjenu, implementaciju, RAG i AI agente."
Fragmentacija lanca alata je i prilika i teret. Svaka karika ima više izbora:
- Vektorske baze podataka: Pinecone, Weaviate, Milvus, pgvector...
- Okviri: LangChain, LlamaIndex, Haystack...
- Procjena: RAGAS, TruLens, Arize...
Što je više izbora, to je veći trošak odlučivanja.
Izbor između RAG-a i finog podešavanja
Na X-u postoji projekt posvećen:
"RAG i projektima finog podešavanja LLM-a."
Ovo je najčešća dilema za tvrtke: Kada koristiti RAG? Kada fino podešavati?
Jednostavno pravilo:
- RAG: Znanje se često mijenja, potrebno je citirati izvore, osjetljivost na troškove
- Fino podešavanje: Stil/format je fiksan, specifičan način zaključivanja, osjetljivost na kašnjenje
Većina poslovnih aplikacija prikladnija je za RAG, jer se poslovno znanje ažurira mnogo brže od ciklusa obuke modela.
Zaključak
Tri ključne promjene u RAG-u u 2026. godini:
- Od dohvaćanja do zaključivanja: Agent ne samo da dohvaća, već i zaključuje o procesu pretraživanja
- Od predloška do proizvodnje: Dostupan je kod za kopiranje i lijepljenje, diferencijacija je u podacima i poslovanju
- Od izbora do odluke: Previše alata, prava sposobnost je odabrati pravu kombinaciju
RAG više nije "dodavanje dodatka LLM-u", već izgradnja inteligentnog sustava s granicama znanja. Granice znanja određuju koje probleme Agent može riješiti, a kvaliteta dohvaćanja određuje točnost odgovora.
LLM bez RAG-a je "inteligentan, ali bez znanja". LLM s RAG-om je "inteligentan i ima znanje". LLM s Agentic RAG-om je "inteligentan, ima znanje i može samostalno učiti".
Pitanje je: Gdje su vaše granice znanja?





