RAGnar Knowledge Processor

Problem

Organizacije često imaju puno korisne dokumentacije, ali ona nije laka za svakodnevnu upotrebu. Upute su u PDF-ovima, pravilnici u DOCX datotekama, procedure u internim mapama, a zaposlenici i dalje pitaju gdje se što nalazi.

Klasičan chatbot nije dovoljno dobar za taj problem. Ako nema pristup izvorima, lako izmišlja. Ako se u njega ubaci veliki PDF bez pripreme, retrieval često vraća preširoke dijelove i model pokušava odgovoriti iz nepotpunog konteksta.

Što je izgrađeno

Izgrađena su dva povezana sloja. RAGnar je self-hosted lokalna RAG platforma za izradu asistenata nad privatnom dokumentacijom. RAGnar Knowledge Processor je pripremni Python pipeline koji PDF/DOCX dokumente čisti, dijeli po temama i sprema kao manje Markdown knowledge datoteke.

RAGnar omogućuje odabir modela, konfiguraciju retrievala, rad s lokalnim embeddingsima, Qdrant vector bazom i prikaz izvora. Knowledge Processor priprema ulaz tako da asistent ne mora raditi nad velikim, šumnim dokumentima.

Kako sustav radi

PDF/DOCX dokument ulazi u Knowledge Processor.
Pipeline izvlači tekst, normalizira ga i prepoznaje naslove ili tematske sekcije.
Sadržaj se sprema u manje Markdown datoteke s naslovima, kategorijama, tagovima i source referencama.
RAGnar ingestira te datoteke, generira embeddinge i sprema ih u Qdrant.
Korisnik kreira asistenta, podešava chunk size, top-k, similarity threshold i temperaturu.
Odgovor prikazuje dokumente, chunkove i source snippetove kako bi korisnik mogao provjeriti kontekst.

Arhitektura

Sustav je složen kao Docker Compose okruženje. Open WebUI služi kao chat i korisničko sučelje, Ollama pokreće lokalne modele, Qdrant čuva vector store, FastAPI upravlja RAGnar endpointima i konfiguracijom, a NGINX rješava routing između Open WebUI sučelja i RAGnar API-ja.

Poseban naglasak stavljen je na transparentnost: asistent ne bi trebao samo vratiti odgovor, nego pokazati koji dokument i koji dio teksta je korišten.

Operativna vrijednost

RAGnar je koristan kao temelj za više internih asistenata: HR procedure, IT dokumentaciju, Linux upute, networking skripte, sigurnosne politike ili onboarding materijale. Umjesto jednog općeg asistenta, svaki može imati svoju dokumentaciju i svoje retrieval postavke.

Knowledge Processor rješava problem koji se često preskoči u AI projektima: pripremu znanja prije samog chata. Manji i čišći Markdown izvori daju stabilniji retrieval, manje halucinacija i jasnije citiranje.

Što je naučeno

Najveća lekcija nije bila da treba veći model. Najveća lekcija je da treba bolji ulaz. Lokalni modeli mogu biti korisni ako je dokumentacija dobro pripremljena, chunkovi smisleni, a prompt dovoljno restriktivan.

Projekt je dobar primjer praktičnog AI engineeringa: infrastruktura, dokumentacijski pipeline, vector search, prompt pravila, source citations i stalno testiranje odgovora rade zajedno. Nijedan dio sam po sebi nije dovoljan.

RAGnar Knowledge Processor mockup s pregledom obrade dokumenata — RAGnar Knowledge Processor priprema dokumente prije nego što završe u retrieval sloju.

RAGnar Knowledge Processor sučelje za obradu knowledge datoteka — Sučelje za pregled obrađenih dokumenata, sekcija i izlaznih knowledge jedinica.

RAGnar Knowledge Processor upload parametri za chunking i obradu dokumenata — Parametri za upload, chunking i pripremu izvora prije ingestiranja u RAG sustav.

RAGnar sučelje za privatne AI asistente i retrieval postavke — RAGnar koristi pripremljene izvore za asistente, modele i provjerljiviji retrieval.

RAGnar mockup privatnog AI sustava nad internim znanjem — Privatni AI sloj povezuje asistente, dokumente, modele i dijagnostiku izvora.

Još primjera

Povezane studije

Support operations · Webhook

HelpBot Ticket Desk

Web i email upiti ulaze u isti proces, prolaze klasifikaciju i završavaju u jasnom ticket zapisu s routing logikom.

Otvori studiju

LogSense i n8n sustav za operativne odgovore

Web operations · PHP

LogSense + n8n

Downtime poruke i operativni upiti pretvaraju se u strukturirani proces koji čita logove i priprema smislen odgovor.

Otvori studiju

Tvoj proces

Imaš dokumentaciju koju bi tim trebao lakše koristiti?

Pošalji gdje se najčešće gube informacije i možemo vidjeti ima li smisla krenuti od knowledge cleanupa, RAG asistenta ili jednostavnijeg internog workflowa.

Pokreni uvodni brief