Wat is het?
Top-p, ook wel nucleus sampling, is een instelling die de woordkeuze van een AI-model stuurt door een dynamische selectiegrens in te stellen. In plaats van een vast aantal kandidaatwoorden te gebruiken, bepaalt het systeem voor elke positie opnieuw welke woorden in aanmerking komen: alle woorden waarvan de gecumuleerde kans de ingestelde waarde bereikt, vormen samen de nucleus.
Een top-p van 0,9 betekent dat het model kiest uit de meest waarschijnlijke woorden die samen 90 procent van de kansmassa vertegenwoordigen. De rest wordt genegeerd, wat zorgt voor een uitgefilterde maar niet te beperkte selectie.
Waarom het ertoe doet voor het MKB
Top-p is een technische instelling die de meeste MKB-gebruikers nooit handmatig aanpassen, maar hij heeft wel invloed op de toon en variatie van AI-output. Begrijpen wat hij doet helpt bij het diagnosticeren van problemen en het kiezen van de juiste vooringestelde AI-tool.
- Een te lage top-p maakt het model eentonig: het herhaalt steeds dezelfde formuleringen, wat storend is in teksten die levendig moeten klinken zoals klantcommunicatie of marketingteksten.
- Een te hoge top-p laat het model ruimere keuzes maken, wat creativiteit vergroot maar ook de kans op vreemde of onsamenhangende zinnen.
- In combinatie met temperature bepalen temperature en top-p samen de aard van de output: temperature stuurt de scherpte van de kansen, top-p bepaalt hoeveel opties er in aanmerking komen.
Voor de meeste zakelijke toepassingen geldt dat de standaardinstellingen voldoen en dat je top-p alleen aanpast als temperature alleen niet het gewenste resultaat geeft.
Hoe het werkt
Top-p werkt door voor elke tokenpositie een drempelwaarde te berekenen op basis van de cumulatieve kans van de meest waarschijnlijke tokens.
- Het model berekent een kansverdeling over alle mogelijke tokens voor de volgende positie.
- De tokens worden gerangschikt van meest waarschijnlijk naar minst waarschijnlijk.
- Het model telt de kansen bij elkaar op van boven naar beneden totdat de som de ingestelde top-p waarde bereikt.
- Alle tokens die buiten die grens vallen worden uitgesloten van de selectie.
- Uit de resterende tokens kiest het model de volgende token, met de kans nog steeds beinvloed door de temperature-instelling.
Het resultaat is een dynamisch venster dat smaller is als de meest waarschijnlijke optie al dominant is, en breder als de kansen gelijkmatiger verdeeld zijn. Daardoor blijft de output coherent in gevallen waar een keuze vanzelfsprekend is, maar heeft het model meer vrijheid op plekken waar meerdere opties realistisch zijn.
Voorbeeld uit de praktijk
Stel, een vastgoedmakelaar gebruikt een AI-tool om woningbeschrijvingen te schrijven. Met een standaard top-p van 0,9 genereert het model teksten die leesbaar en gevarieerd zijn zonder onlogische zinnen te produceren. Als de eigenaar de top-p verlaagt naar 0,5, worden de teksten veiliger maar ook eentoniger: het model herhaalt steeds dezelfde beschrijvende termen. Verhoogt hij hem naar 0,99, dan kunnen de teksten creatiever worden maar ook af en toe een vreemde woordkeuze bevatten die handmatig gecorrigeerd moet worden.
Vergelijking en misvattingen
Temperature schroeft de kansen van alle tokens omhoog of omlaag als een globale schakelaar; top-p snijdt de staart van de minst waarschijnlijke opties weg als een selectiedrempel. Samen bepalen ze de speelruimte van het model. Het aanbevolen startpunt: pas eerst temperature aan en laat top-p op de standaardwaarde staan totdat dat echt tekortschiet.

