Terug naar portfolio
GenAI
RAG
Python
LLM
RAG-systeem voor interne kennisbank
Showcase project
4 weken
De uitdaging
Honderden beleidsdocumenten, handleidingen en rapporten in verschillende formaten. Medewerkers besteedden gemiddeld 45 minuten per zoekactie. Bestaande zoekfuncties werkten alleen op exacte trefwoorden.
De aanpak
Een Retrieval-Augmented Generation (RAG) systeem dat:
- Documenten verwerkt en opslaat als doorzoekbare embeddings
- Vragen in natuurlijke taal accepteert
- Relevante passages vindt via semantische zoekfunctionaliteit
- Een samenhangend antwoord formuleert met bronverwijzingen
Architectuur
- Document processing: PDF/Word extractie, chunking met overlap
- Embedding: Tekst-naar-vector conversie voor semantische vergelijking
- Vector store: Efficiënte opslag en zoekfunctionaliteit
- Query engine: Vraag → retrieval → LLM → antwoord met bronnen
- Frontend: Eenvoudige chat-interface voor eindgebruikers
Het resultaat
- Zoektijd: van 45 minuten naar 30 seconden
- Nauwkeurigheid: 92% correct bij validatie
- Adoptie: 80% dagelijks gebruik binnen 2 weken
Technologie
Python, LangChain, OpenAI embeddings, ChromaDB, Streamlit