Token

De maateenheid waarmee AI-modellen tekst verwerken en waarmee gebruik en kosten worden bepaald.

Token, tekeneenheid

Definitie

Een token is de kleinste teksteenheid die een AI-model verwerkt: doorgaans een deel van een woord, een heel woord of een leesteken. AI-modellen lezen, genereren en rekenen in tokens.

Wat is het?

Een token is de kleinste eenheid tekst die een AI-model verwerkt. In de meeste Engelse modellen is een token gemiddeld ongeveer vier tekens of driekwart woord; in Nederlands zijn tokens iets korter door de langere woorden. Een zin van tien woorden bestaat doorgaans uit dertien tot vijftien tokens.

Tokens zijn de basiseenheid van alles wat een taalmodel doet: elk woord dat je invoert wordt opgesplitst in tokens, elk woord dat het model uitvoert is een token. De limiet van het contextvenster, de prijs van API-gebruik en de snelheid van een model worden allemaal uitgedrukt in tokens.

Waarom het ertoe doet voor het MKB

Voor een MKB-eigenaar die AI-tools inzet, bepalen tokens twee praktische zaken: wat er in een gesprek past en wat het kost.

  • Het contextvenster van een model, het maximale geheugen per sessie, is begrensd in tokens. Lange documenten, uitgebreide e-mailthreads of grote datasets moeten worden opgesplitst of samengevat om binnen die limiet te blijven.
  • API-gebruik voor AI-diensten wordt gefactureerd per token: hoe meer tekst in en uit, hoe hoger de kosten. Beknopte, goed gerichte instructies zijn dus ook economisch slim.
  • Snelheid en capaciteitsplanning hangen af van het tokenvolume: een agent die dagelijks duizenden facturen verwerkt, genereert een groot tokenvolume dat in de architectuur moet worden meegenomen.

Je hoeft tokens niet te tellen om goed met AI te werken, maar het concept helpt bij het begrijpen waarom een model een lang document niet in een keer kan verwerken of waarom een bepaalde taak meer kost dan verwacht.

Hoe het werkt

Taalmodellen werken niet met letters of woorden maar met tokens, die worden bepaald door een tokenizer: een algoritme dat tekst opsplitst in stukken die het model herkent op basis van zijn trainingsdata.

  1. De tekst die je invoert wordt door de tokenizer opgesplitst in tokens, elk een stuk dat het model als een eenheid herkent.
  2. Elk token krijgt een numerieke ID die het model gebruikt bij het verwerken van de invoer.
  3. Het model genereert de output token voor token, waarbij elke nieuw gegenereerde token de volgende beinvloedt.
  4. De gegenereerde token-IDs worden door de tokenizer terugvertaald naar leesbare tekst.

Omdat de tokenizer per model verschilt, kan hetzelfde stuk tekst in GPT-4 een ander aantal tokens bevatten dan in Claude of Gemini. Dat is relevant als je budgetten of limieten vergelijkt tussen verschillende AI-diensten.

Voorbeeld uit de praktijk

Stel, een administratiekantoor verwerkt maandelijks tientallen inkoopfacturen via een AI-agent. De agent leest elke factuur, extraheert de leverancier, het bedrag en de vervaldatum, en verwerkt die gegevens in het boekhoudpakket. Elke factuur van een A4 omvat ruwweg 400 tot 600 tokens. Bij vijftig facturen per dag verwerkt de agent dagelijks tienduizenden tokens. Dat volume is nuttig om te weten bij het kiezen van een AI-dienst en het inschatten van de maandelijkse kosten.

Vergelijking en misvattingen

Een token is niet hetzelfde als een woord, maar dat is het snelste mentale model voor dagelijks gebruik. Nauwkeuriger is het om te zeggen dat een woord gemiddeld anderhalf token beslaat in Nederlandse tekst. Tokens zijn de maateenheid voor AI-modellen; woorden zijn de maateenheid voor mensen.

Veelgestelde vragen

Wat is een token in de context van AI?
Een token is de kleinste eenheid tekst die een taalmodel verwerkt: gemiddeld vier tekens of driekwart van een woord. 'Hallo wereld' is twee tokens. Tokens zijn relevant omdat API-gebruik op basis van tokens wordt geprijsd en de context window in tokens wordt gemeten.
Hoeveel tokens zijn in de praktijk genoeg?
Voor een eenvoudige vraag en antwoord: enkele honderden tokens. Voor een lang document of uitgebreide systeeminstructie: tienduizenden. Moderne modellen ondersteunen context windows van 128.000 tokens en meer, wat neerkomt op zo'n honderd bladzijden tekst.
Hoe bespaar je op tokengebruik?
Houd systeem-prompts beknopt maar compleet. Verwijder onnodige context. Gebruik een kleiner model voor eenvoudige taken. Overweeg samenvatten als de input te lang is. Bij hoge volumes maakt tokenoptimalisatie een merkbaar verschil in kosten.
Van inzicht naar impact

Benieuwd wat AI
in jouw processen oplevert?

In een gratis kennismaking kijken we waar AI bij jou het meeste tijd bespaart, en hoe een verbonden opzet eruitziet.