Evolucija RAG-a: Od poboljšanja preuzimanja do zaključivanja pomoću agenata
Do 2026. godine, RAG (Retrieval-Augmented Generation - Generisanje uz pomoć poboljšanog preuzimanja) je evoluirao od "dodavanja polja za pretragu LLM-u" do kompletnog sistema agenata.
Od preuzimanja do zaključivanja
Neko je na X-u ukazao na ključnu promenu:
"Izgradnja AI agenta koji može da zaključuje o pretragama – a ne samo da ih preuzima."
Ovo je suštinska razlika RAG 2.0. Tradicionalni RAG je dvostepeni proces "preuzimanje → generisanje". Nova paradigma je ciklus agenta "preuzimanje → zaključivanje → akcija".
Agent ne ubacuje rezultate pretrage u prompt, već razume nameru pretrage, procenjuje kvalitet informacija i odlučuje da li je potrebno više preuzimanja. Ovo je nadogradnja od "korisnika alata" do "istraživača".
Vector Search 2.0
Neko je na X-u podelio najnoviji napredak:
"Pokazivanje kako se osnovni Agentic RAG sistem može izgraditi za oko 10 minuta sa novim Vector Search 2.0 i ADK."
Vektorska pretraga više nije jednostavno podudaranje sličnosti. Nova verzija podržava:
- Hibridno preuzimanje (vektori + ključne reči)
- Višestepeno zaključivanje (jedno preuzimanje pokreće drugo)
- Dinamičko preuređivanje (prilagođavanje rezultata na osnovu konteksta)
Ovo omogućava RAG-u da evoluira od "pronalaženja relevantnih dokumenata" do "izgradnje puteva znanja".
LLM aplikacije spremne za produkciju
Neko je na X-u sastavio listu:
"Kolekcija svih LLM aplikacija spremnih za produkciju u 2026. godini. awesome-llm-apps sadrži kod koji se može direktno kopirati i nalepiti za RAG, agente, multimodalne aplikacije i AI SaaS proizvode."
Ovo odražava zrelost industrije: od "eksperimenta" do "šablonizacije". Kada se RAG aplikacije mogu kopirati i nalepiti, diferencijacija više nije sama tehnologija, već kvalitet podataka i razumevanje poslovanja.
100+ LLM biblioteka alata
Neko je na X-u sastavio:
"LLM inženjerski alatni set: 100+ odabranih lista LLM biblioteka i okvira za obuku, fino podešavanje, izgradnju, procenu, implementaciju, RAG i AI agente."
Fragmentacija lanca alata je i prilika i teret. Svaki korak ima više izbora:
- Vektorske baze podataka: Pinecone, Weaviate, Milvus, pgvector...
- Okviri: LangChain, LlamaIndex, Haystack...
- Procena: RAGAS, TruLens, Arize...
Što je više izbora, to je veći trošak donošenja odluka.
Izbor između RAG-a i finog podešavanja
Na X-u postoji projekat posvećen:
"RAG i projekti finog podešavanja za LLM."
Ovo je najčešća dilema za preduzeća: kada koristiti RAG? Kada fino podešavati?
Jednostavno pravilo:
- RAG: Znanje se često menja, potrebno je citirati izvore, osetljivo na troškove
- Fino podešavanje: Stil/format je fiksan, specifičan obrazac zaključivanja, osetljivo na kašnjenje
Većina poslovnih aplikacija je pogodnija za RAG, jer se poslovno znanje ažurira mnogo brže od ciklusa obuke modela.
Zaključak
Tri ključne promene u RAG-u u 2026. godini:
- Od preuzimanja do zaključivanja: Agent ne samo da preuzima, već i zaključuje o procesu pretrage
- Od šablona do produkcije: Dostupan je kod za kopiranje i nalepiti, diferencijacija je u podacima i poslovanju
- Od izbora do odluke: Previše alata, prava sposobnost je odabir prave kombinacije
RAG više nije "dodavanje dodatka LLM-u", već izgradnja inteligentnog sistema sa granicama znanja. Granice znanja određuju koje probleme agent može da reši, a kvalitet preuzimanja određuje tačnost odgovora.
LLM bez RAG-a je "inteligentan, ali bez znanja". LLM sa RAG-om je "inteligentan i ima znanje". LLM sa Agentic RAG-om je "inteligentan, ima znanje i može samostalno da uči".
Pitanje je: gde su vaše granice znanja?





