Wat is het?
Bij fine-tuning neem je een al getraind taalmodel, zoals GPT-4o of een open-source variant als Mistral of Llama, en train je het verder op een beperkte set voorbeelden die kenmerkend zijn voor jouw taak of domein. Het model leert de gewenste uitvoerstijl, terminologie, toonzetting of classificatielogica zonder dat de algemene kennis verloren gaat.
Fine-tuning is niet hetzelfde als een model helemaal opnieuw trainen. Het startpunt is een bestaand, al krachtig model; fine-tuning verfijnt het gedrag voor een specifiek doel met aanzienlijk minder data en rekenkracht. Voor het MKB is fine-tuning relevant als je wilt dat een model altijd in een vaste stijl schrijft, factuurregels consequent classificeert of cv-samenvattingen opmaakt in je eigen format.
Waarom het ertoe doet voor het MKB
Een generiek taalmodel doet veel goed, maar presteert niet altijd consistent op specialistische of sterk gestructureerde taken. Als het model telkens anders antwoordt op een gelijksoortige vraag, of de toon of opmaak niet aansluit bij je huisstijl, is fine-tuning een optie om dat aan te scherpen. Het is de keuze voor gedrag en stijl boven kennisopslag.
- Consistente uitvoer voor herhalende taken. Een fijnafgestemd model geeft op vergelijkbare invoer vergelijkbare uitvoer, wat cruciaal is bij facturenclassificatie, uittrekselgeneratie of standaardcorrespondentie.
- Domeinspecifieke terminologie zonder uitleg. Als jij 'ERP-boeking', 'VVE-bijdrage' of 'inlenersbeloning' schrijft, begrijpt een fijnafgestemd model direct de context, zonder dat je dat elke keer hoeft te omschrijven in de prompt.
- Minder promptengineering nodig. Door gedrag in het model te trainen in plaats van het elke keer via lange instructies te sturen, worden prompts korter en betrouwbaarder.
Fine-tuning is de meest geschikte aanpak als de taak stabiel en herhalend is en je geen continu bijgewerkte documentbronnen nodig hebt. Zodra het antwoord afhankelijk is van actuele of klantspecifieke informatie, is document grounding (RAG) de betere keuze.
Hoe het werkt
Fine-tuning vereist een trainingsset van invoer-uitvoer-paren die het gewenste modelgedrag demonstreren. Hoe meer en kwalitatief betere voorbeelden, hoe beter het resultaat. Het proces verloopt doorgaans via een platform of API van de modelleverancier, zoals OpenAI's fine-tuning API of open-source tools als Hugging Face.
- Data samenstellen: verzamel honderden tot duizenden voorbeelden van de taak, bestaande uit een invoer en de ideale uitvoer die het model moet leren produceren.
- Data opschonen: verwijder inconsistenties, corrigeer fouten en zorg dat de voorbeelden representatief zijn voor alle situaties die het model zal tegenkomen.
- Trainingsrun starten: de data wordt via de fine-tuning API of trainingstool door het basismodel gestuurd, waarbij de modelparameters worden bijgesteld.
- Evalueren: het verfijnde model wordt getest op een aparte evaluatieset om te beoordelen of het gewenste gedrag is aangeleerd en of het niet overfitted is op de trainingsdata.
- Inzetten en monitoren: het verfijnde model vervangt of vult het generieke model aan in de productieomgeving, en prestaties worden bijgehouden om te bepalen wanneer hertraining nodig is.
Hertraining is nodig zodra de taak verandert of de data veroudert. Fine-tuning is geen eenmalige ingreep maar een onderhoudscyclus.
Voorbeeld uit de praktijk
Stel, een uitzendbureau wil dat zijn AI-assistent cv-samenvattingen altijd oplevert in een vaste structuur: eerst de kernkwalificaties, dan de relevante werkervaring, dan de beschikbaarheid. Een generiek model schrijft dit telkens anders op. Na fine-tuning op enkele honderden goedgekeurde samenvattingen uit de interne database levert het model consequent de juiste opmaak, in de huisstijl van het bureau, zonder dat de recruiter de structuur steeds opnieuw in de prompt moet beschrijven.
Vergelijking en misvattingen
Fine-tuning past het gedrag en de stijl van het model aan op basis van trainingsdata; document grounding (RAG) laat het model antwoorden op basis van actuele, aangeleverde documenten. Fine-tuning is beter voor consistente opmaak en stabiele taaklogica; RAG is beter als het antwoord afhankelijk is van veranderende of klantspecifieke informatie die je wilt kunnen herleiden tot een bron.

