RAG-systeem voor interne kennisbank

Showcase project

4 weken

De uitdaging

Honderden beleidsdocumenten, handleidingen en rapporten in verschillende formaten. Medewerkers besteedden gemiddeld 45 minuten per zoekactie. Bestaande zoekfuncties werkten alleen op exacte trefwoorden.

De aanpak

Een Retrieval-Augmented Generation (RAG) systeem dat:

Documenten verwerkt en opslaat als doorzoekbare embeddings
Vragen in natuurlijke taal accepteert
Relevante passages vindt via semantische zoekfunctionaliteit
Een samenhangend antwoord formuleert met bronverwijzingen

Architectuur

Document processing: PDF/Word extractie, chunking met overlap
Embedding: Tekst-naar-vector conversie voor semantische vergelijking
Vector store: Efficiënte opslag en zoekfunctionaliteit
Query engine: Vraag → retrieval → LLM → antwoord met bronnen
Frontend: Eenvoudige chat-interface voor eindgebruikers

Het resultaat

Zoektijd: van 45 minuten naar 30 seconden
Nauwkeurigheid: 92% correct bij validatie
Adoptie: 80% dagelijks gebruik binnen 2 weken

Technologie

Python, LangChain, OpenAI embeddings, ChromaDB, Streamlit