Evolucija RAG-a: Od proširenog pretraživanja do zaključivanja pomoću agenata

2/17/2026
3 min read

Do 2026. godine, RAG (Retrieval-Augmented Generation - Generisanje prošireno pretraživanjem) je evoluirao od "dodavanja polja za pretragu LLM-u" do kompletnog sistema agenata.

Od pretraživanja do zaključivanja

Neko je na X-u istakao ključnu promjenu:

"Izgradnja AI agenta koji je sposoban da zaključuje o pretragama – a ne samo da ih pretražuje."

Ovo je ključna razlika RAG-a 2.0. Tradicionalni RAG je dvostepeni proces "pretraživanje → generisanje". Nova paradigma je agentni ciklus "pretraživanje → zaključivanje → akcija".

Agent ne ubacuje rezultate pretrage u prompt, već razumije namjeru pretrage, procjenjuje kvalitet informacija i odlučuje da li je potrebno više pretraga. Ovo je nadogradnja od "korisnika alata" do "istraživača".

Vector Search 2.0

Neko je na X-u podijelio najnoviji napredak:

"Pokazivanje kako se pomoću novog Vector Search 2.0 i ADK može izgraditi osnovni Agentic RAG sistem za oko 10 minuta."

Pretraga vektora više nije jednostavno podudaranje sličnosti. Nova verzija podržava:

  • Hibridno pretraživanje (vektori + ključne riječi)
  • Višestepeno zaključivanje (jedna pretraga pokreće drugu)
  • Dinamičko preuređivanje (prilagođavanje rezultata na osnovu konteksta)

Ovo omogućava RAG-u da evoluira od "pronalaženja relevantnih dokumenata" do "izgradnje puteva znanja".

LLM aplikacije spremne za produkciju

Neko je na X-u sastavio listu:

"Kolekcija svih LLM aplikacija spremnih za produkciju u 2026. godini. awesome-llm-apps sadrži kod koji se može direktno kopirati i zalijepiti za RAG, agente, multimodalne aplikacije i AI SaaS proizvode."

Ovo odražava zrelost industrije: od "eksperimenta" do "šablonizacije". Kada se RAG aplikacije mogu kopirati i zalijepiti, diferencijacija više nije sama tehnologija, već kvalitet podataka i razumijevanje poslovanja.

100+ LLM biblioteka alata

Neko je na X-u sastavio:

"LLM inženjerski alatni set: 100+ odabranih lista LLM biblioteka i okvira za obuku, fino podešavanje, izgradnju, evaluaciju, implementaciju, RAG i AI agente."

Fragmentacija lanca alata je i prilika i teret. Svaki korak ima više izbora:

  • Vektorske baze podataka: Pinecone, Weaviate, Milvus, pgvector...
  • Okviri: LangChain, LlamaIndex, Haystack...
  • Evaluacija: RAGAS, TruLens, Arize...

Što je više izbora, veći su troškovi odlučivanja.

Izbor između RAG-a i finog podešavanja

Na X-u postoji projekat posvećen:

"RAG i projektima finog podešavanja za LLM-ove."

Ovo je najčešća dilema za preduzeća: Kada koristiti RAG? Kada fino podešavati?

Jednostavno pravilo:

  • RAG: Znanje se često mijenja, potrebno je citirati izvore, osjetljivo na troškove
  • Fino podešavanje: Stil/format je fiksiran, specifičan način zaključivanja, osjetljivo na kašnjenje

Većina poslovnih aplikacija je pogodnija za RAG, jer se poslovno znanje ažurira mnogo brže od ciklusa obuke modela.

Zaključak

Tri ključne promjene u RAG-u u 2026. godini:

  1. Od pretraživanja do zaključivanja: Agent ne samo da pretražuje, već i zaključuje o procesu pretrage
  2. Od šablona do produkcije: Dostupan je kod za kopiranje i lijepljenje, diferencijacija je u podacima i poslovanju
  3. Od izbora do odluke: Previše alata, prava sposobnost je odabir prave kombinacije

RAG više nije "dodavanje dodatka LLM-u", već izgradnja inteligentnog sistema sa granicama znanja. Granice znanja određuju koje probleme Agent može riješiti, a kvalitet pretraživanja određuje tačnost odgovora.

LLM bez RAG-a je "inteligentan, ali bez znanja". LLM sa RAG-om je "inteligentan i ima znanje". LLM sa Agentic RAG-om je "inteligentan, ima znanje i može samostalno učiti".

Pitanje je: Gdje su vaše granice znanja?

Published in Technology

You Might Also Like