Wat is het?
Document grounding is de praktijk van het koppelen van een AI-taalmodel aan een specifieke set documenten, zodat het model zijn antwoorden baseert op die bronnen in plaats van op de algemene kennis waarmee het getraind is. In de meest gangbare implementatievorm, retrieval-augmented generation (RAG), worden relevante tekstfragmenten uit jouw documenten opgehaald en samen met de vraag aan het model aangeboden.
Het resultaat is een AI die antwoordt met de precieze informatie uit jouw dossiers, contracten, handleidingen of procedures, met de mogelijkheid om de bronpassage erbij te tonen. Dat maakt de uitkomst controleerbaar, wat in gereguleerde sectoren als administratie en vastgoed een vereiste is.
Waarom het ertoe doet voor het MKB
Taalmodellen hallucineren: ze geven soms plausibel klinkende maar onjuiste antwoorden als ze iets niet weten. In een bedrijfscontext, waar medewerkers vragen stellen over contracten, procedures of klantdossiers, is dat onacceptabel. Document grounding pakt dit probleem bij de wortel aan door het model te verplichten zijn antwoord te ontlenen aan verifieerbare bronnen.
- Antwoorden zijn herleidbaar. De AI kan tonen welk fragment uit welk document de basis vormt van het antwoord, zodat een medewerker het zelf kan controleren.
- De kennisbasis blijft actueel. Zodra een document wordt bijgewerkt in het systeem, geeft de AI automatisch antwoorden op basis van de nieuwe versie, zonder dat een model opnieuw hoeft te worden getraind.
- Compliance wordt haalbaar. In sectoren met strenge informatieplichten, zoals accountancy of vastgoedbeheer, is aantoonbare bronverwijzing een vereiste voor verantwoord gebruik van AI.
Document grounding maakt van een generiek taalmodel een betrouwbare assistent voor jouw specifieke organisatie, zonder dat je het model zelf hoeft te trainen.
Hoe het werkt
Document grounding combineert een zoekmechanisme met een taalmodel. De documenten worden vooraf verwerkt en doorzoekbaar gemaakt. Bij een vraag worden de meest relevante fragmenten opgehaald en meegegeven aan het model, dat vervolgens een antwoord formuleert op basis van die specifieke informatie.
- Documenten verwerken: de bronbestanden (pdf, Word, e-mail, database) worden omgezet in doorzoekbare eenheden en, in moderne implementaties, omgezet in embeddings voor semantisch zoeken.
- Index opbouwen: de fragmenten worden opgeslagen in een vectordatabase of zoekindex.
- Vraag verwerken: bij een inkomende vraag zoekt het systeem naar de meest relevante fragmenten in de index.
- Context samenstellen: de gevonden fragmenten worden samen met de vraag aan het taalmodel aangeboden als context.
- Antwoord genereren: het model formuleert een antwoord op basis van de meegestuurde fragmenten en kan de bron erbij vermelden.
Cruciaal hierbij is de kwaliteit van de documentindex: slecht gestructureerde of verouderde documenten leiden ook bij grounding tot slechte antwoorden. De AI is zo goed als de bronnen die je hem geeft.
Voorbeeld uit de praktijk
Stel, een makelaarskantoor wil dat medewerkers snel vragen kunnen stellen over huurovereenkomsten, VvE-reglementen en inspectierapportages zonder elk document zelf te moeten doorzoeken. Via document grounding worden al deze bestanden per pand in een doorzoekbare index opgenomen. Een medewerker vraagt: 'Welke clausule regelt de servicekosten voor pand X?' Het systeem haalt de relevante passage op uit het correcte huurcontract en toont het antwoord met een directe verwijzing naar de bron. De medewerker kan het in seconden verifiëren.
Vergelijking en misvattingen
Document grounding (RAG) laat het model antwoorden op basis van jouw actuele documenten; fine-tuning past de parameters van het model zelf aan op basis van trainingsdata. Het verschil is dat grounding werkt met veranderende, verifieerbare bronnen, terwijl fine-tuning gedrag of stijl aanleert dat niet makkelijk terug te traceren is naar een specifiek document.

