Private Document AI voor het Nederlandse MKB
Wat het is, wanneer het loont, hoe je het AVG-bewust opzet en wat het in de praktijk oplevert. Een gestructureerd dossier voor beslissers.
/ DOSSIER ESSENTIE
Alles wat je moet weten over private document ai voor het Nederlandse MKB, in één gestructureerd dossier.
Onderdeel van
Private Document AIPILLAR/PRIVATE DOCUMENT AI
PUBLICATIE·6 JUNI 2026
Bij vrijwel elke MKB-onderneming die we de afgelopen maanden spraken, ging het over hetzelfde knelpunt: er zit kennis in handleidingen, offertes, contracten, dossiers en hoofden van collega's, en die kennis is verschrikkelijk slecht doorzoekbaar. ChatGPT lost dat half op. Bij twee nieuwe vragen lost het het al niet meer op. Want ChatGPT kent jouw Deye-handleiding niet, jouw productlijn niet, jouw klantdossier niet, jouw boekhoudregels niet. Het kent het internet tot een bepaald moment en de bestanden die je toevallig in een chat sleept. Voor incidenteel werk is dat prima. Voor structureel werk niet. Daar komt private document AI in beeld.
Dit dossier legt uit wat private document AI is, hoe het technisch werkt, wat het AVG-bewust opzetten in de praktijk betekent, en waarom een Nederlands MKB-bedrijf er beter aan kan beginnen voordat de concurrent dat doet. Het is geschreven voor beslissers, niet voor engineers. De praktijkvoorbeelden komen uit ons eigen werk: we draaien zelf inmiddels ruim dertig agents over vijf servers, lokaal én in de cloud, en we publiceren de patronen waar wij elke dag mee werken.1
/ 01Het probleem
Het probleem dat je probeert op te lossen
Stel je een installatiebedrijf voor met tweeduizend SKU's, een partner-portaal voor installateurs, een serviceteam dat dagelijks vragen beantwoordt, en een verkoopteam dat offertes schrijft. De kennis die deze mensen elke dag opzoeken zit in handleidingen, productspecificaties, certificeringen, prijslijsten, offerte-templates en interne notities. Bij elke vraag is het zoeken. Veertig procent van de zoektijd levert uiteindelijk het antwoord niet eens op: men vraagt het door aan een collega die het wél weet, of belt de leverancier.
Datzelfde patroon zien we bij advieskantoren met dossiers per cliënt, bij groothandels met technische productlijnen, bij accountantskantoren met fiscale wetgeving, bij ingenieursbureaus met normbladen. Het probleem is niet dat de kennis er niet is. Het probleem is dat de kennis niet doorzoekbaar is op de manier waarop iemand een vraag stelt: in normale Nederlandse taal, op locatie, onder tijdsdruk.
Generieke tools als ChatGPT, Microsoft Copilot of Notion AI lossen dit slechts gedeeltelijk op. Ze zijn fantastisch in het begrijpen van een vraag en het formuleren van een antwoord, maar ze kennen jouw documenten niet structureel. Je kunt bestanden uploaden, maar daarna verdwijnen ze of gelden ze alleen voor die sessie. Wat je nodig hebt, is een omgeving die je documenten permanent en doorzoekbaar maakt, in een opzet die je begrijpt en kunt uitleggen aan een jurist.
/ 02Wat het is
Wat private document AI precies is
Private document AI is geen product, het is een opzet. Concreet bestaat het uit drie elementen die we voor jou bouwen en beheren:
- Een vector-database waarin de inhoud van jouw documenten ligt opgeslagen in een vorm die een taalmodel kan begrijpen. Niet letterlijk de woorden, maar de betekenis ervan, omgezet naar vectoren.
- Een retrieval-laag die bij elke vraag eerst de meest relevante fragmenten uit jouw vector-database ophaalt voordat een antwoord wordt geformuleerd.
- Een taalmodel dat het antwoord formuleert op basis van die fragmenten, met expliciete bronverwijzing zodat je antwoord natrekbaar is.
Het woord privaat verwijst hier niet naar een eigen taalmodel (dat kan wel, op aanvraag, maar is niet nodig voor het meeste werk). Het verwijst naar de andere drie elementen: jouw documenten staan in een afgeschermde omgeving, scheidbaar per klant of vestiging als dat relevant is, en jouw vragen en antwoorden lekken niet weg naar een gedeeld trainingsproces.
Niet je eigen model bouwen. Je eigen documenten doorzoekbaar maken voor een gespecialiseerd model, in een opzet die je begrijpt en kunt uitleggen.Werkdefinitie · Dossier private document AI
Dit onderscheid is belangrijk. Veel verkoopverhalen verwarren private document AI met een privaat LLM. Dat zijn twee verschillende dingen. Een privaat LLM betekent dat het taalmodel zelf op jouw infrastructuur draait, meestal op een dedicated GPU. Dat is voor de meeste MKB-bedrijven overkill, duur, en biedt nauwelijks praktisch voordeel boven een API van OpenAI of Anthropic met enterprise-instellingen. Private document AI is het echte commerciële winstmoment. Privaat LLM is een aparte upgrade voor wie hele strenge eisen heeft.
/ 03Architectuur
Hoe het werkt onder de motorkap
De gangbare architectuur heet RAG, kort voor retrieval-augmented generation. Het is een zorgvuldig getemde manier om een taalmodel niet uit zijn duim te laten zuigen, maar te laten praten op basis van jouw documenten. Onderstaand schema laat de vijf stappen zien die elke vraag doorloopt.
SCHEMA/RETRIEVAL-AUGMENTED GENERATION
VRAAG
Gebruiker stelt een vraag in normale taal
EMBED
Vraag wordt omgezet naar een betekenis-vector
RETRIEVE
Meest relevante chunks gehaald uit jouw vector-store
AUGMENT
Context plus vraag samen naar het taalmodel
ANTWOORD
Antwoord in jouw context, met bronverwijzing
ACTUEEL · STAP 01
Gebruiker stelt een vraag in normale taal
Wat hier interessant is, is dat geen van deze stappen mysterie is. Elke laag heeft een specifieke functie en kan onafhankelijk worden geüpgraded. De vector-store kan in een Nederlands of Europees datacenter staan. Het taalmodel kan worden uitgewisseld voor een ander (OpenAI, Anthropic, zelf-gehoste opties) zonder je documenten te verhuizen. De retrieval-strategie kan worden aangescherpt voor jouw domein. Allemaal te beheren en te meten, want elke vraag laat een spoor achter dat je kunt controleren.
Een vraag stellen is in onze opzet één regel: "Welke certificering hoort bij het Pro-pakket en welke documenten lever ik bij oplevering?" Het antwoord wijst direct naar het paragraafnummer in de handleiding waarop het is gebaseerd. Niet omdat dit toevallig leuk is, maar omdat dit de enige manier is waarop een installateur op locatie het antwoord kan verifiëren voordat hij ernaar handelt. Voor meer concrete voorbeelden uit onze dagelijkse praktijk, zie ons artikel AI op handleidingen: vijf scenario's voor installateurs en groothandels.
/ 04Verwachtingen
Wat het wel en niet doet
Goede verwachtingen vooraf besparen later teleurstelling. Hieronder de eerlijke afbakening van wat private document AI op MKB-niveau wel en niet voor je doet.
Wat het wel doet
- Antwoorden uit jouw documenten in normale taal, met bronverwijzing.
- Vergelijkbare informatie uit verschillende documenten samenvatten.
- Eerste reactie op een mail of ticket voorbereiden, mens keurt goed.
- Onderlinge inconsistenties tussen documenten signaleren als je daarnaar vraagt.
- Vertaalslag maken van vakjargon naar klantvriendelijke taal en omgekeerd.
Wat het niet doet
- Live data ophalen die niet in jouw documenten staat (geen Shopify-orders, geen CRM-records, tenzij we daar bewust een aparte koppeling voor bouwen).
- Toekomstgegevens voorspellen. Het kent alleen wat in de documenten staat.
- Documenten verbeteren zonder dat een mens akkoord geeft. Het kan suggesties doen, niet eigenstandig wijzigen.
- Beoordelen of een antwoord juridisch sluitend is. Daarvoor is altijd menselijk oordeel nodig.
/ 05AVG
AVG, scheidbare tenants en data-locatie
Voor Nederlandse MKB-bedrijven valt of staat een AI-keuze met privacy en gegevensbescherming. We beloven geen 100% AVG-garantie, want die geeft niemand verantwoord af zonder juridische dekking per geval. Wel kunnen we de opzet helder beschrijven, zodat jij en je adviseur er een gefundeerd oordeel over kunnen vellen.
Data-locatie
Standaard plaatsen we de vector-store in een EU-datacenter. Per use case bespreken we welke regio bij jouw verplichtingen past. Voor de meeste MKB-bedrijven is een EU-omgeving voldoende. Voor strikte sectoren (zorg, juridisch) bekijken we per geval wat extra eisen vraagt.
Scheidbare tenants
Elke klant krijgt een afgescheiden vector-store. Geen gedeelde tabel, geen kans op vermenging. Dit is geen logische scheiding op database-rij, maar een fysieke scheiding op tenant-niveau. Voor advieskantoren of andere organisaties die per cliënt moeten kunnen scheiden, kunnen we binnen één klantomgeving sub-tenants per cliënt opzetten.
Modeltraining
Standaard gebruiken we OpenAI of Anthropic via hun enterprise-API. In beide gevallen zetten we de instellingen zo dat je input niet wordt gebruikt om hun modellen te trainen.2 Voor wie zelfs deze afhankelijkheid wil vermijden, is er de optie van een zelf-gehost open-weight model op managed GPU.
Audit-log
Elke vraag en elk antwoord wordt gelogd: wie vroeg wat, wanneer, met welke bronnen geantwoord. Dat is geen surveillance, dat is verantwoording. Een compliance officer kan steekproefsgewijs nagaan of de antwoorden in lijn zijn met intern beleid. Voor een uitgebreidere uitleg specifiek over AVG-verplichtingen, zie ons artikel AVG en je AI-werkplek: wat moet je geregeld hebben.
/ 06Vergelijking
Wanneer je hiervoor kiest
Niet elke organisatie heeft baat bij private document AI. Onderstaand rastert wanneer je het overweegt en wanneer een eenvoudiger alternatief beter past.
| Situatie | Eenvoudig alternatief | Private document AI |
|---|---|---|
| Incidentele AI-vragen, geen vast werkproces | ChatGPT-abonnement | Te zwaar opgezet |
| Vast werkproces met repeat-vragen over interne docs | Niet voldoende | De juiste keuze |
| Meerdere medewerkers die toegang tot dezelfde kennis nodig hebben | Onpraktisch | Sterk |
| Klant- of dossiergevoelige scheiding noodzakelijk | Onvoldoende veilig | Vereist · scheidbare tenants |
| Documenten veranderen vaak en team werkt 24/7 op locatie | Mogelijk, niet ideaal | Sterk · centrale bron van waarheid |
| Volledig zelf gehoste model verplicht (sectorale reden) | n.v.t. | Mogelijk met private LLM-upgrade |
Voor een diepere vergelijking specifiek tussen private document AI en generieke enterprise-AI-tools, zie ons artikel Private AI vs ChatGPT Enterprise voor MKB.
/ 07Implementatie
Hoe een eerste implementatie eruitziet
Wij hanteren een vaste-prijs aanpak voor de eerste opzet. De Quickstart levert in zeven werkdagen een werkende eerste versie op voor één bedrijfsproces. Geen open scope, geen onbeperkte iteratie. Hieronder de ritmiek.
- DAG 101
Intake en use case
Vraag aanscherpen, één meetbaar resultaat afspreken. Documenten benoemen die we gaan opnemen. - DAG 2 EN 302
Architectuur en setup
Vector-store opzetten, modelkeuze maken, tenant inrichten, login regelen. - DAG 4 EN 503
Documenten en finetunen
Ingestie van jouw bronnen, eerste tests met realistische vragen, retrieval-parameters bijstellen. - DAG 6 EN 704
Training, oplevering, live
Korte teamtraining van 60 tot 90 minuten, schriftelijke handleiding, dan live met 30 dagen support.
/ 08Kosten
Kosten en opbrengst
De vaste-prijs Quickstart kost tussen €750 en €1.500 eenmalig, afhankelijk van scope. Daarna is er een optioneel beheer-abonnement vanaf €299 per maand voor monitoring, updates en support. Dit zijn de bedragen voor de beta-fase. Na bewezen toepassing voor onze eerste paar pilots, zullen we de standaard-prijzen herzien.
€0
VANAF, EENMALIG
0 dagen
TOT WERKEND
0 dagen
SUPPORT INBEGREPEN
€0/mnd
OPTIONEEL BEHEER
Belangrijker dan de prijs is wat het oplevert. We meten dat per klant anders, maar de typische opbrengstposten zijn:
- Minder zoektijd per vraag. Van minuten naar seconden, opgeteld over een team en een werkdag levert dat snel een halve fte aan tijdwinst per maand op.
- Snellere klantreactie. Service of verkoop kan eerste reacties binnen minuten geven in plaats van uren.
- Minder fouten door verouderde info. Mensen baseren antwoorden op de centrale bron in plaats van op hun geheugen of een oud document op een netwerkschijf.
- Nieuwe medewerkers zijn sneller productief. De collectieve kennis is doorzoekbaar in plaats van afhankelijk van wie op kantoor is.
Op één werkproces, één team van vier mensen, één eerste versie binnen een week: ongeveer twintig minuten zoektijd per persoon per dag bespaard.Eigen meting · webshop in zonne-energie
/ 09Valkuilen
Veelgemaakte fouten
We hebben er inmiddels veel zien gebeuren. Vier patronen die we keer op keer tegenkomen en die we proberen te voorkomen.
Te brede scope in de eerste week
De meest voorkomende fout is een eerste versie te ambitieus opzetten: "Laten we meteen alles erin gooien." Het resultaat is een matige eerste ervaring met te veel verkeerde antwoorden, omdat retrieval over alle domeinen heen niet goed werkt zonder afstelling. Beter: één use case scherp, één type bron, daarna pas uitbreiden.
Geen review-proces voor bronnen
Documenten worden geüpdatet, contracten veranderen, tarieven schuiven. Als niemand verantwoordelijk is voor de actualiteit van de bron, geeft het systeem na een paar maanden verouderde antwoorden. Het is geen AI-probleem, het is een organisatie-probleem dat we proberen vooraf te ondervangen.
Te veel of te weinig vertrouwen
Sommige teams gebruiken het antwoord onmiddellijk zonder verificatie. Andere teams gebruiken het helemaal niet omdat ze het niet vertrouwen. Beide zijn onproductief. De juiste mind-set: gebruik het antwoord als een goede eerste schatting met bronverwijzing, en verifieer voor je ernaar handelt in een klant- of compliance-gevoelig moment.
Vergeten van de gebruikerservaring
Een mooie technische opzet die slecht in de werkdag past wordt niet gebruikt. Wij integreren bewust dicht bij waar het werk gebeurt: in een eigen chat-interface, of soms als een hulpvenster naast het systeem dat het team al gebruikt. Adoptie is een design-vraag, niet alleen een technische.
/ 10Verder
Drie volgende stappen
Als dit dossier je hielp om de propositie scherper te krijgen, zijn er drie logische volgende stappen, in oplopende mate van commitment.
- Lees verder in dit dossier. Onze spoke-artikelen gaan dieper op specifieke aspecten in: RAG in plain Nederlands, Private AI vs ChatGPT Enterprise, vijf scenario's voor installateurs.
- Bekijk hoe wij dit aanbieden. De Private AI-pagina beschrijft onze opzet, security en use cases met meer detail.
- Plan een intake-gesprek. 30 minuten online of in Barneveld. We bepalen samen of een Quickstart past en welke use case logisch is. Geen verkoop, geen verplichtingen vooraf. Reactie binnen 24 uur na het intake-formulier.
BRONVERMELDINGEN
- 01MKB Compute is opgericht door de mensen achter EcoHandel, Nova-Cell en De Kei Zonnepanelen. Op meerdere sites en servers draaien wij volledig automatisch via AI-agents. De architectuurpatronen in dit artikel zijn afkomstig uit die operatie.
- 02OpenAI en Anthropic bieden in hun zakelijke API expliciet de optie om input uit te sluiten van modeltraining. Bij gebruik van een privaat LLM op dedicated GPU is er geen externe partij in het pad.
OVER DE AUTEURS
Milan de Romijn
Oprichter
Bouwt en runt MKB Compute samen met Tom. Verantwoordelijk voor operations, agent-orkestratie en klant-implementatie.
Tom Bekker
Oprichter
Bouwt en runt MKB Compute samen met Milan. Verantwoordelijk voor sales, klant-relatie en technische architectuur.
VOLGENDE STAP/PRIVATE AI
Plan een Private AI-gesprek van 30 minuten. Binnen 24 uur reactie.
We bespreken concreet welke documenten en gebruikers het meest opleveren. Een eerste werkende versie staat in 7 dagen.
VERDER LEZEN IN HETZELFDE DOSSIER
Meer uit Private Document AI.
VELDVERSLAG·9 min
RAG uitgelegd in plain Nederlands
Retrieval-augmented generation in normale taal, zonder jargon. Waarom dit de gangbare aanpak is voor AI die op jouw documenten antwoord geeft.
Lees verder →VELDVERSLAG·11 min
Private AI vs ChatGPT Enterprise voor MKB
Een eerlijke vergelijking. Wanneer ChatGPT Enterprise voldoende is, wanneer private document AI de juiste keuze wordt en wanneer ze elkaar aanvullen.
Lees verder →VELDVERSLAG·8 min
AI op handleidingen: vijf scenario's voor installateurs en groothandels
Concrete praktijkscenario's voor sectoren met veel productdocumentatie. Wat private document AI in een week kan opleveren bij installateurs en technische groothandels.
Lees verder →