Wat is het?
Geheugen in AI-agents bestaat uit twee lagen. Kortetermijngeheugen omvat alles wat een agent tijdens de lopende sessie bijhoudt: de instructies, de gesprekshistorie en de data die al is opgehaald. Zodra de sessie eindigt, verdwijnt dit geheugen, tenzij het wordt opgeslagen.
Langetermijngeheugen is kennis die buiten de sessie wordt bewaard, doorgaans in een database of vector store. Een agent kan die kennis opvragen wanneer die relevant is, waardoor hij bij een volgend gesprek verder kan gaan waar het vorige ophield, of bedrijfsspecifieke informatie kan raadplegen die niet in zijn training zat.
Waarom het ertoe doet voor het MKB
Zonder geheugen begint een AI-agent elke taak opnieuw. Dat werkt voor losse vragen, maar niet voor processen waarbij context opbouwt over tijd: klantrelaties, projectstatus, eerder gemaakte afspraken. Geheugen is de factor die een agent van een eenmalig gereedschap tot een werkende digitale medewerker maakt.
- Kortetermijngeheugen zorgt dat een agent een meerstaps-taak coherent afmaakt: het onthoudt wat al is gedaan en past daar de volgende stap op aan, zonder dat je alles opnieuw hoeft te herhalen.
- Langetermijngeheugen maakt personalisatie en continuiteit mogelijk: een agent die een klant herkent, zijn eerdere vragen kent en op die context voortbouwt, levert betere output dan een agent die elke keer blanco begint.
- Goed geheugenbeheer is ook een beveiligingsvraagstuk: wat een agent onthoudt, moet je kunnen inzien, controleren en wissen, zeker als het om klantgegevens gaat.
De keuze welk geheugen je inzet, hoelang je het bewaart en wie er toegang toe heeft, is een ontwerpoordeel dat bepalend is voor hoe bruikbaar en veilig een agent in de praktijk is.
Hoe het werkt
Kortetermijngeheugen werkt via de context window van het model: alle tekst die in het huidige gesprek is uitgewisseld, zit daarin en is zichtbaar voor het model. Langetermijngeheugen werkt via externe opslag die de agent actief moet bevragen.
- Tijdens een sessie slaat de agent de gesprekshistorie op in de context window.
- Als relevante informatie uit het verleden nodig is, stuurt de agent een zoekopdracht naar de externe geheugenopslag.
- De opgehaalde informatie wordt toegevoegd aan de huidige context, zodat het model erop kan redeneren.
- Na de sessie kan de agent relevante nieuwe informatie wegschrijven naar de externe opslag voor toekomstig gebruik.
De context window heeft een limiet: bij zeer lange sessies of veel achtergrondmateriaal moet je prioriteren welke informatie erin past. Goede geheugenstrategie is daarmee een technisch en inhoudelijk ontwerpvraagstuk tegelijk.
Voorbeeld uit de praktijk
Stel, een makelaarskantoor gebruikt een AI-agent voor klantcommunicatie. De agent heeft toegang tot een langetermijngeheugen met de zoekprofiel-gegevens van iedere klant: gewenste regio, budgetrange, type woning en eerder bekeken objecten. Wanneer een klant contact opneemt, haalt de agent zijn profiel op en stelt een persoonlijk gerichte reactie op zonder dat de klant zijn wensen opnieuw hoeft te noemen. Nieuw genoemde voorkeuren schrijft de agent na het gesprek weg naar het profiel.
Vergelijking en misvattingen
Kortetermijngeheugen is actief zolang het gesprek loopt en verdwijnt daarna: vergelijkbaar met werkgeheugen bij een mens. Langetermijngeheugen is persistent opgeslagen en blijft beschikbaar over sessies heen, maar de agent moet het actief opvragen. Het verschil zit in duur en in hoe de informatie wordt bewaard en ontsloten.

