Top-p (Nucleus Sampling)

Een instelling die bepaalt hoe breed of smal het AI-model zijn woordkeuzes maakt, en zo creativiteit en coherentie in balans houdt.

Top-p, nucleus sampling, p-sampling

Definitie

Top-p, ook wel nucleus sampling, is een instelling die bepaalt uit hoeveel mogelijke opties een AI-model kiest bij het genereren van tekst: het model beperkt zich tot de meest waarschijnlijke opties totdat hun gecumuleerde kans de ingestelde drempelwaarde bereikt.

Wat is het?

Top-p, ook wel nucleus sampling, is een instelling die de woordkeuze van een AI-model stuurt door een dynamische selectiegrens in te stellen. In plaats van een vast aantal kandidaatwoorden te gebruiken, bepaalt het systeem voor elke positie opnieuw welke woorden in aanmerking komen: alle woorden waarvan de gecumuleerde kans de ingestelde waarde bereikt, vormen samen de nucleus.

Een top-p van 0,9 betekent dat het model kiest uit de meest waarschijnlijke woorden die samen 90 procent van de kansmassa vertegenwoordigen. De rest wordt genegeerd, wat zorgt voor een uitgefilterde maar niet te beperkte selectie.

Waarom het ertoe doet voor het MKB

Top-p is een technische instelling die de meeste MKB-gebruikers nooit handmatig aanpassen, maar hij heeft wel invloed op de toon en variatie van AI-output. Begrijpen wat hij doet helpt bij het diagnosticeren van problemen en het kiezen van de juiste vooringestelde AI-tool.

  • Een te lage top-p maakt het model eentonig: het herhaalt steeds dezelfde formuleringen, wat storend is in teksten die levendig moeten klinken zoals klantcommunicatie of marketingteksten.
  • Een te hoge top-p laat het model ruimere keuzes maken, wat creativiteit vergroot maar ook de kans op vreemde of onsamenhangende zinnen.
  • In combinatie met temperature bepalen temperature en top-p samen de aard van de output: temperature stuurt de scherpte van de kansen, top-p bepaalt hoeveel opties er in aanmerking komen.

Voor de meeste zakelijke toepassingen geldt dat de standaardinstellingen voldoen en dat je top-p alleen aanpast als temperature alleen niet het gewenste resultaat geeft.

Hoe het werkt

Top-p werkt door voor elke tokenpositie een drempelwaarde te berekenen op basis van de cumulatieve kans van de meest waarschijnlijke tokens.

  1. Het model berekent een kansverdeling over alle mogelijke tokens voor de volgende positie.
  2. De tokens worden gerangschikt van meest waarschijnlijk naar minst waarschijnlijk.
  3. Het model telt de kansen bij elkaar op van boven naar beneden totdat de som de ingestelde top-p waarde bereikt.
  4. Alle tokens die buiten die grens vallen worden uitgesloten van de selectie.
  5. Uit de resterende tokens kiest het model de volgende token, met de kans nog steeds beinvloed door de temperature-instelling.

Het resultaat is een dynamisch venster dat smaller is als de meest waarschijnlijke optie al dominant is, en breder als de kansen gelijkmatiger verdeeld zijn. Daardoor blijft de output coherent in gevallen waar een keuze vanzelfsprekend is, maar heeft het model meer vrijheid op plekken waar meerdere opties realistisch zijn.

Voorbeeld uit de praktijk

Stel, een vastgoedmakelaar gebruikt een AI-tool om woningbeschrijvingen te schrijven. Met een standaard top-p van 0,9 genereert het model teksten die leesbaar en gevarieerd zijn zonder onlogische zinnen te produceren. Als de eigenaar de top-p verlaagt naar 0,5, worden de teksten veiliger maar ook eentoniger: het model herhaalt steeds dezelfde beschrijvende termen. Verhoogt hij hem naar 0,99, dan kunnen de teksten creatiever worden maar ook af en toe een vreemde woordkeuze bevatten die handmatig gecorrigeerd moet worden.

Vergelijking en misvattingen

Temperature schroeft de kansen van alle tokens omhoog of omlaag als een globale schakelaar; top-p snijdt de staart van de minst waarschijnlijke opties weg als een selectiedrempel. Samen bepalen ze de speelruimte van het model. Het aanbevolen startpunt: pas eerst temperature aan en laat top-p op de standaardwaarde staan totdat dat echt tekortschiet.

Veelgestelde vragen

Wat is top-p of nucleus sampling?
Top-p is een methode om de willekeurigheid in AI-output te begrenzen. Het model selecteert alleen uit de subset tokens die samen een bepaalde kans (p) dekt. Stel je top-p in op 0.9, dan overweegt het model alleen de tokens die samen 90% van de waarschijnlijkheid vertegenwoordigen. Dit vermindert onverwachte uitkomsten zonder de creativiteit volledig te beperken.
Wanneer pas je top-p aan?
Als je te onvoorspelbare output ervaart maar temperature al op een redelijke waarde staat. Top-p is nuttig als je creatieve output wil maar de meest extreme uitkomsten wil vermijden. In de meeste zakelijke toepassingen is de standaardwaarde (0.9 of 1.0) goed; aanpassen is zinvol bij het fijn afstellen van specifieke generatietaken.
Moet je zowel temperature als top-p instellen?
Nee, en het is af te raden om beide tegelijk te wijzigen. Ze werken beide in op hoe tokens worden geselecteerd; samen aanpassen maakt het lastig te bepalen wat welk effect heeft. Kies één als primaire parameter en laat de andere op de standaardwaarde.
Van inzicht naar impact

Benieuwd wat AI
in jouw processen oplevert?

In een gratis kennismaking kijken we waar AI bij jou het meeste tijd bespaart, en hoe een verbonden opzet eruitziet.