Wat is private document-AI?

Private document-AI is geen kant-en-klaar product maar een opzet die jouw eigen documenten doorzoekbaar maakt voor een taalmodel. Het bestaat uit een vector-database met de betekenis van je documenten, een retrieval-laag die de relevante fragmenten ophaalt, en een taalmodel dat het antwoord formuleert met bronverwijzing. Het draait in een afgeschermde omgeving die je kunt uitleggen aan een jurist.

Is private document-AI hetzelfde als een eigen AI-model trainen?

Nee. Private document-AI gaat niet over het trainen van een eigen taalmodel, maar over je eigen documenten zoekbaar maken voor een bestaand model. Een privaat LLM op dedicated GPU kan wel, maar is voor de meeste MKB-bedrijven overkill en duur. Het commerciële winstmoment zit in de document-AI zelf, niet in een eigen model.

Hoe werkt private document-AI met de AVG?

We plaatsen de vector-store standaard in een EU-datacenter en bespreken per use case welke regio past. Elke klant krijgt een fysiek afgescheiden vector-store, dus geen gedeelde tabel en geen vermenging. Bij gebruik van OpenAI of Anthropic via de enterprise-API zetten we de instellingen zo dat je input niet voor modeltraining wordt gebruikt, en elke vraag wordt gelogd met wie, wanneer en welke bronnen.

Wat kost private document-AI en hoe snel staat het?

De vaste-prijs Quickstart kost tussen 750 en 1.500 euro eenmalig, afhankelijk van scope, en levert binnen zeven werkdagen een werkende eerste versie op voor één bedrijfsproces. Daarna is er 30 dagen support inbegrepen en een optioneel beheer-abonnement vanaf 299 euro per maand. Dit zijn de bèta-prijzen voor 2026.

Wat levert private document-AI op?

De grootste post is minder zoektijd per vraag, van minuten naar seconden, wat opgeteld over een team snel een halve fte aan tijdwinst per maand kan opleveren. Daarnaast snellere klantreacties, minder fouten door verouderde info omdat iedereen op één centrale bron werkt, en nieuwe medewerkers die sneller productief zijn omdat de collectieve kennis doorzoekbaar is.

PILLAR22 min leestijd

Private document-AI uitgelegd: zo werkt het voor het MKB

Wat het is, wanneer het loont, hoe je het AVG-bewust opzet en wat het in de praktijk oplevert. Een gestructureerd dossier voor beslissers.

Milan de Romijn Tom Bekker

6 juni 2026

/ DOSSIER ESSENTIE

Private AI: alles wat je moet weten voor het Nederlandse MKB, in één gestructureerd dossier.

Onderdeel van

Private Document AI

PILLAR/PRIVATE DOCUMENT AI

PUBLICATIE·6 JUNI 2026

Bij vrijwel elke MKB-onderneming die we de afgelopen maanden spraken, ging het over hetzelfde knelpunt: er zit kennis in handleidingen, offertes, contracten, dossiers en hoofden van collega's, en die kennis is verschrikkelijk slecht doorzoekbaar. ChatGPT lost dat half op. Bij twee nieuwe vragen lost het het al niet meer op. Want ChatGPT kent jouw Deye-handleiding niet, jouw productlijn niet, jouw klantdossier niet, jouw boekhoudregels niet. Het kent het internet tot een bepaald moment en de bestanden die je toevallig in een chat sleept. Voor incidenteel werk is dat prima. Voor structureel werk niet. Daar komt private document AI in beeld.

Dit dossier legt uit wat private document AI is, hoe het technisch werkt, wat het AVG-bewust opzetten in de praktijk betekent, en waarom een Nederlands MKB-bedrijf er beter aan kan beginnen voordat de concurrent dat doet. Het is geschreven voor beslissers, niet voor engineers. De praktijkvoorbeelden komen uit ons eigen werk: we draaien zelf inmiddels ruim dertig agents over vijf servers, lokaal én in de cloud, en we publiceren de patronen waar wij elke dag mee werken.¹

/ 01Het probleem

Het probleem dat je probeert op te lossen

Stel je een installatiebedrijf voor met tweeduizend SKU's, een partner-portaal voor installateurs, een serviceteam dat dagelijks vragen beantwoordt, en een verkoopteam dat offertes schrijft. De kennis die deze mensen elke dag opzoeken zit in handleidingen, productspecificaties, certificeringen, prijslijsten, offerte-templates en interne notities. Bij elke vraag is het zoeken. Veertig procent van de zoektijd levert uiteindelijk het antwoord niet eens op: men vraagt het door aan een collega die het wél weet, of belt de leverancier.

Datzelfde patroon zien we bij advieskantoren met dossiers per cliënt, bij groothandels met technische productlijnen, bij accountantskantoren met fiscale wetgeving, bij ingenieursbureaus met normbladen. Het probleem is niet dat de kennis er niet is. Het probleem is dat de kennis niet doorzoekbaar is op de manier waarop iemand een vraag stelt: in normale Nederlandse taal, op locatie, onder tijdsdruk.

Generieke tools als ChatGPT, Microsoft Copilot of Notion AI lossen dit slechts gedeeltelijk op. Ze zijn fantastisch in het begrijpen van een vraag en het formuleren van een antwoord, maar ze kennen jouw documenten niet structureel. Je kunt bestanden uploaden, maar daarna verdwijnen ze of gelden ze alleen voor die sessie. Wat je nodig hebt, is een omgeving die je documenten permanent en doorzoekbaar maakt, in een opzet die je begrijpt en kunt uitleggen aan een jurist.

/ 02Wat het is

Wat private document AI precies is

Private document AI is geen product, het is een opzet. Concreet bestaat het uit drie elementen die we voor jou bouwen en beheren:

Een vector-database waarin de inhoud van jouw documenten ligt opgeslagen in een vorm die een taalmodel kan begrijpen. Niet letterlijk de woorden, maar de betekenis ervan, omgezet naar vectoren.
Een retrieval-laag die bij elke vraag eerst de meest relevante fragmenten uit jouw vector-database ophaalt voordat een antwoord wordt geformuleerd.
Een taalmodel dat het antwoord formuleert op basis van die fragmenten, met expliciete bronverwijzing zodat je antwoord natrekbaar is.

Het woord privaat verwijst hier niet naar een eigen taalmodel (dat kan wel, op aanvraag, maar is niet nodig voor het meeste werk). Het verwijst naar de andere drie elementen: jouw documenten staan in een afgeschermde omgeving, scheidbaar per klant of vestiging als dat relevant is, en jouw vragen en antwoorden lekken niet weg naar een gedeeld trainingsproces.

Niet je eigen model bouwen. Je eigen documenten doorzoekbaar maken voor een gespecialiseerd model, in een opzet die je begrijpt en kunt uitleggen.

Werkdefinitie · Dossier private document AI

Dit onderscheid is belangrijk. Veel verkoopverhalen verwarren private document AI met een privaat LLM. Dat zijn twee verschillende dingen. Een privaat LLM betekent dat het taalmodel zelf op jouw infrastructuur draait, meestal op een dedicated GPU. Dat is voor de meeste MKB-bedrijven overkill, duur, en biedt nauwelijks praktisch voordeel boven een API van OpenAI of Anthropic met enterprise-instellingen. Private document AI is het echte commerciële winstmoment. Privaat LLM is een aparte upgrade voor wie hele strenge eisen heeft.

/ 03Architectuur

Hoe het werkt onder de motorkap

De gangbare architectuur heet RAG, kort voor retrieval-augmented generation. Het is een zorgvuldig getemde manier om een taalmodel niet uit zijn duim te laten zuigen, maar te laten praten op basis van jouw documenten. Onderstaand schema laat de vijf stappen zien die elke vraag doorloopt.

SCHEMA/RETRIEVAL-AUGMENTED GENERATION

VRAAG

Gebruiker stelt een vraag in normale taal

EMBED

Vraag wordt omgezet naar een betekenis-vector

RETRIEVE

Meest relevante chunks gehaald uit jouw vector-store

AUGMENT

Context plus vraag samen naar het taalmodel

ANTWOORD

Antwoord in jouw context, met bronverwijzing

ACTUEEL · STAP 01

Gebruiker stelt een vraag in normale taal

Figuur 1 · Schematische RAG-pijplijn die de live-demo op /private-ai aandrijft

Wat hier interessant is, is dat geen van deze stappen mysterie is. Elke laag heeft een specifieke functie en kan onafhankelijk worden geüpgraded. De vector-store kan in een Nederlands of Europees datacenter staan. Het taalmodel kan worden uitgewisseld voor een ander (OpenAI, Anthropic, zelf-gehoste opties) zonder je documenten te verhuizen. De retrieval-strategie kan worden aangescherpt voor jouw domein. Allemaal te beheren en te meten, want elke vraag laat een spoor achter dat je kunt controleren.

Een vraag stellen is in onze opzet één regel: "Welke certificering hoort bij het Pro-pakket en welke documenten lever ik bij oplevering?" Het antwoord wijst direct naar het paragraafnummer in de handleiding waarop het is gebaseerd. Niet omdat dit toevallig leuk is, maar omdat dit de enige manier is waarop een installateur op locatie het antwoord kan verifiëren voordat hij ernaar handelt. Voor meer concrete voorbeelden uit onze dagelijkse praktijk, zie ons artikel AI op handleidingen: vijf scenario's voor installateurs en groothandels.

/ 04Verwachtingen

Wat het wel en niet doet

Goede verwachtingen vooraf besparen later teleurstelling. Hieronder de eerlijke afbakening van wat private document AI op MKB-niveau wel en niet voor je doet.

Wat het wel doet

Antwoorden uit jouw documenten in normale taal, met bronverwijzing.
Vergelijkbare informatie uit verschillende documenten samenvatten.
Eerste reactie op een mail of ticket voorbereiden, mens keurt goed.
Onderlinge inconsistenties tussen documenten signaleren als je daarnaar vraagt.
Vertaalslag maken van vakjargon naar klantvriendelijke taal en omgekeerd.

Wat het niet doet

Live data ophalen die niet in jouw documenten staat (geen Shopify-orders, geen CRM-records, tenzij we daar bewust een aparte koppeling voor bouwen).
Toekomstgegevens voorspellen. Het kent alleen wat in de documenten staat.
Documenten verbeteren zonder dat een mens akkoord geeft. Het kan suggesties doen, niet eigenstandig wijzigen.
Beoordelen of een antwoord juridisch sluitend is. Daarvoor is altijd menselijk oordeel nodig.

/ 05AVG

AVG, scheidbare tenants en data-locatie

Voor Nederlandse MKB-bedrijven valt of staat een AI-keuze met privacy en gegevensbescherming. We beloven geen 100% AVG-garantie, want die geeft niemand verantwoord af zonder juridische dekking per geval. Wel kunnen we de opzet helder beschrijven, zodat jij en je adviseur er een gefundeerd oordeel over kunnen vellen.²

Data-locatie

Standaard plaatsen we de vector-store in een EU-datacenter. Per use case bespreken we welke regio bij jouw verplichtingen past. Voor de meeste MKB-bedrijven is een EU-omgeving voldoende. Voor strikte sectoren (zorg, juridisch) bekijken we per geval wat extra eisen vraagt.

Scheidbare tenants

Elke klant krijgt een afgescheiden vector-store. Geen gedeelde tabel, geen kans op vermenging. Dit is geen logische scheiding op database-rij, maar een fysieke scheiding op tenant-niveau. Voor advieskantoren of andere organisaties die per cliënt moeten kunnen scheiden, kunnen we binnen één klantomgeving sub-tenants per cliënt opzetten.

Modeltraining

Standaard gebruiken we OpenAI of Anthropic via hun enterprise-API. In beide gevallen zetten we de instellingen zo dat je input niet wordt gebruikt om hun modellen te trainen.³ Voor wie zelfs deze afhankelijkheid wil vermijden, is er de optie van een zelf-gehost open-weight model op managed GPU.

Audit-log

Elke vraag en elk antwoord wordt gelogd: wie vroeg wat, wanneer, met welke bronnen geantwoord. Dat is geen surveillance, dat is verantwoording. Een compliance officer kan steekproefsgewijs nagaan of de antwoorden in lijn zijn met intern beleid. Voor een uitgebreidere uitleg specifiek over AVG-verplichtingen, zie ons artikel AVG en je AI-werkplek: wat moet je geregeld hebben.

/ 06Vergelijking

Wanneer je hiervoor kiest

Niet elke organisatie heeft baat bij private document AI. Onderstaand rastert wanneer je het overweegt en wanneer een eenvoudiger alternatief beter past.

Situatie	Eenvoudig alternatief	Private document AI
Incidentele AI-vragen, geen vast werkproces	ChatGPT-abonnement	Te zwaar opgezet
Vast werkproces met repeat-vragen over interne docs	Niet voldoende	De juiste keuze
Meerdere medewerkers die toegang tot dezelfde kennis nodig hebben	Onpraktisch	Sterk
Klant- of dossiergevoelige scheiding noodzakelijk	Onvoldoende veilig	Vereist · scheidbare tenants
Documenten veranderen vaak en team werkt 24/7 op locatie	Mogelijk, niet ideaal	Sterk · centrale bron van waarheid
Volledig zelf gehoste model verplicht (sectorale reden)	n.v.t.	Mogelijk met private LLM-upgrade

Beslismatrix · wanneer private document AI loont

Voor een diepere vergelijking specifiek tussen private document AI en generieke enterprise-AI-tools, zie ons artikel Private AI vs ChatGPT Enterprise voor MKB.

/ 07Implementatie

Hoe een eerste implementatie eruitziet

Wij hanteren een vaste-prijs aanpak voor de eerste opzet. De Quickstart levert in zeven werkdagen een werkende eerste versie op voor één bedrijfsproces. Geen open scope, geen onbeperkte iteratie. Hieronder de ritmiek.

DAG 101
Intake en use case
Vraag aanscherpen, één meetbaar resultaat afspreken. Documenten benoemen die we gaan opnemen.
DAG 2 EN 302
Architectuur en setup
Vector-store opzetten, modelkeuze maken, tenant inrichten, login regelen.
DAG 4 EN 503
Documenten en finetunen
Ingestie van jouw bronnen, eerste tests met realistische vragen, retrieval-parameters bijstellen.
DAG 6 EN 704
Training, oplevering, live
Korte teamtraining van 60 tot 90 minuten, schriftelijke handleiding, dan live met 30 dagen support.

Het Quickstart-ritme · vaste prijs, vaste oplevering

/ 08Kosten

Kosten en opbrengst

De vaste-prijs Quickstart kost tussen €750 en €1.500 eenmalig, afhankelijk van scope. Daarna is er een optioneel beheer-abonnement vanaf €299 per maand voor monitoring, updates en support. Dit zijn de bedragen voor de bèta-fase. Na bewezen toepassing voor onze eerste paar pilots, zullen we de standaard-prijzen herzien.

€0

VANAF, EENMALIG

0 dagen

TOT WERKEND

0 dagen

SUPPORT INBEGREPEN

€0/mnd

OPTIONEEL BEHEER

Bèta-prijzen, geldig in 2026

Belangrijker dan de prijs is wat het oplevert. We meten dat per klant anders, maar de typische opbrengstposten zijn:

Minder zoektijd per vraag. Van minuten naar seconden, opgeteld over een team en een werkdag levert dat snel een halve fte aan tijdwinst per maand op.
Snellere klantreactie. Service of verkoop kan eerste reacties binnen minuten geven in plaats van uren.
Minder fouten door verouderde info. Mensen baseren antwoorden op de centrale bron in plaats van op hun geheugen of een oud document op een netwerkschijf.
Nieuwe medewerkers zijn sneller productief. De collectieve kennis is doorzoekbaar in plaats van afhankelijk van wie op kantoor is.

Op één werkproces, één team van vier mensen, één eerste versie binnen een week: ongeveer twintig minuten zoektijd per persoon per dag bespaard.

Eigen meting · webshop in zonne-energie

/ 09Valkuilen

Veelgemaakte fouten

We hebben er inmiddels veel zien gebeuren. Vier patronen die we keer op keer tegenkomen en die we proberen te voorkomen.

Te brede scope in de eerste week

De meest voorkomende fout is een eerste versie te ambitieus opzetten: "Laten we meteen alles erin gooien." Het resultaat is een matige eerste ervaring met te veel verkeerde antwoorden, omdat retrieval over alle domeinen heen niet goed werkt zonder afstelling. Beter: één use case scherp, één type bron, daarna pas uitbreiden.

Geen review-proces voor bronnen

Documenten worden geüpdatet, contracten veranderen, tarieven schuiven. Als niemand verantwoordelijk is voor de actualiteit van de bron, geeft het systeem na een paar maanden verouderde antwoorden. Het is geen AI-probleem, het is een organisatie-probleem dat we proberen vooraf te ondervangen.

Te veel of te weinig vertrouwen

Sommige teams gebruiken het antwoord onmiddellijk zonder verificatie. Andere teams gebruiken het helemaal niet omdat ze het niet vertrouwen. Beide zijn onproductief. De juiste mind-set: gebruik het antwoord als een goede eerste schatting met bronverwijzing, en verifieer voor je ernaar handelt in een klant- of compliance-gevoelig moment.

Vergeten van de gebruikerservaring

Een mooie technische opzet die slecht in de werkdag past wordt niet gebruikt. Wij integreren bewust dicht bij waar het werk gebeurt: in een eigen chat-interface, of soms als een hulpvenster naast het systeem dat het team al gebruikt. Adoptie is een design-vraag, niet alleen een technische.

/ 10Verder

Drie volgende stappen

Als dit dossier je hielp om de propositie scherper te krijgen, zijn er drie logische volgende stappen, in oplopende mate van commitment.

Lees verder in dit dossier. Onze spoke-artikelen gaan dieper op specifieke aspecten in: RAG in plain Nederlands, Private AI vs ChatGPT Enterprise, vijf scenario's voor installateurs. Voor een concreet werkproces van begin tot eind: AI-mailtriage voor klantenservice. Twijfel je of je AI moet "trainen" of beter je documenten laat lezen, met een eerlijke kostenvergelijking: AI trainen op je eigen data, kan dat en wat kost het. En voor een sector met de strengste privacy-eisen: private AI voor de zorg, en voor de documentstromen van een boekhoud- of accountantskantoor binnen de AVG en de geheimhoudingsplicht: private AI voor accountants: documentverwerking binnen de AVG. Wil je weten welke rekenkracht hier onder draait en wanneer huren slimmer is dan zelf hardware kopen, lees dan AI-capaciteit.
Bekijk hoe wij dit aanbieden. De Private AI-pagina beschrijft onze opzet, security en use cases met meer detail.
Plan een intake-gesprek. 30 minuten online of in Barneveld. We bepalen samen of een Quickstart past en welke use case logisch is. Geen verkoop, geen verplichtingen vooraf. Reactie binnen 24 uur na het intake-formulier.

BRONVERMELDINGEN

01MKB Compute is opgericht door de mensen achter EcoHandel, Nova-Cell en De Kei Zonnepanelen. Op meerdere sites en servers draaien wij volledig automatisch via AI-agents. De architectuurpatronen in dit artikel zijn afkomstig uit die operatie.
02De Autoriteit Persoonsgegevens publiceert actuele uitleg en normen over de inzet van AI en algoritmes onder de AVG: www.autoriteitpersoonsgegevens.nl
03OpenAI en Anthropic bieden in hun zakelijke API expliciet de optie om input uit te sluiten van modeltraining. Bij gebruik van een privaat LLM op dedicated GPU is er geen externe partij in het pad.

OVER DE AUTEURS

Milan de Romijn

Oprichter

Bouwt en runt MKB Compute samen met Tom. Verantwoordelijk voor operations, agent-orkestratie en klant-implementatie.

Tom Bekker

Oprichter

Bouwt en runt MKB Compute samen met Milan. Verantwoordelijk voor sales, klant-relatie en technische architectuur.

/ FAQ/VEELGESTELDE VRAGEN

Wat je waarschijnlijk wil weten.

Veelgestelde vragen over dit onderwerp.

Q01
Wat is private document-AI?
Private document-AI is geen kant-en-klaar product maar een opzet die jouw eigen documenten doorzoekbaar maakt voor een taalmodel. Het bestaat uit een vector-database met de betekenis van je documenten, een retrieval-laag die de relevante fragmenten ophaalt, en een taalmodel dat het antwoord formuleert met bronverwijzing. Het draait in een afgeschermde omgeving die je kunt uitleggen aan een jurist.
Q02
Is private document-AI hetzelfde als een eigen AI-model trainen?
Nee. Private document-AI gaat niet over het trainen van een eigen taalmodel, maar over je eigen documenten zoekbaar maken voor een bestaand model. Een privaat LLM op dedicated GPU kan wel, maar is voor de meeste MKB-bedrijven overkill en duur. Het commerciële winstmoment zit in de document-AI zelf, niet in een eigen model.
Q03
Hoe werkt private document-AI met de AVG?
We plaatsen de vector-store standaard in een EU-datacenter en bespreken per use case welke regio past. Elke klant krijgt een fysiek afgescheiden vector-store, dus geen gedeelde tabel en geen vermenging. Bij gebruik van OpenAI of Anthropic via de enterprise-API zetten we de instellingen zo dat je input niet voor modeltraining wordt gebruikt, en elke vraag wordt gelogd met wie, wanneer en welke bronnen.
Q04
Wat kost private document-AI en hoe snel staat het?
De vaste-prijs Quickstart kost tussen 750 en 1.500 euro eenmalig, afhankelijk van scope, en levert binnen zeven werkdagen een werkende eerste versie op voor één bedrijfsproces. Daarna is er 30 dagen support inbegrepen en een optioneel beheer-abonnement vanaf 299 euro per maand. Dit zijn de bèta-prijzen voor 2026.
Q05
Wat levert private document-AI op?
De grootste post is minder zoektijd per vraag, van minuten naar seconden, wat opgeteld over een team snel een halve fte aan tijdwinst per maand kan opleveren. Daarnaast snellere klantreacties, minder fouten door verouderde info omdat iedereen op één centrale bron werkt, en nieuwe medewerkers die sneller productief zijn omdat de collectieve kennis doorzoekbaar is.

VOLGENDE STAP/PRIVATE AI

Plan een Private AI-gesprek van 30 minuten. Binnen 24 uur reactie.

We bespreken concreet welke documenten en gebruikers het meest opleveren. Een eerste werkende versie staat in 7 dagen.

Plan Private AI gesprek→Lees over Private AI

VERDER LEZEN IN HETZELFDE DOSSIER

Jaarrekeningen, grootboek, facturen en aangiftes automatisch laten verwerken zonder cliëntdata in een gedeelde cloud-tool te plakken. Documentverwerking binnen de AVG en je geheimhoudingsplicht, praktisch opgezet.

Lees verder →

Het probleem dat je probeert op te lossen

Wat private document AI precies is

Hoe het werkt onder de motorkap

Wat het wel en niet doet

Wat het wel doet

Wat het niet doet

AVG, scheidbare tenants en data-locatie

Data-locatie

Scheidbare tenants

Modeltraining

Audit-log

Wanneer je hiervoor kiest

Hoe een eerste implementatie eruitziet

Intake en use case

Architectuur en setup

Documenten en finetunen

Training, oplevering, live

Kosten en opbrengst

Veelgemaakte fouten

Te brede scope in de eerste week

Geen review-proces voor bronnen

Te veel of te weinig vertrouwen

Vergeten van de gebruikerservaring

Drie volgende stappen

Wat je waarschijnlijk wil weten.

Wat is private document-AI?

Is private document-AI hetzelfde als een eigen AI-model trainen?

Hoe werkt private document-AI met de AVG?

Wat kost private document-AI en hoe snel staat het?

Wat levert private document-AI op?

Plan een Private AI-gesprek van 30 minuten. Binnen 24 uur reactie.

Meer uit Private Document AI.

RAG uitgelegd in plain Nederlands

Private AI vs ChatGPT Enterprise voor MKB

AI op handleidingen: vijf scenario's voor installateurs en groothandels

AI Act voor het MKB: wat je voor 2 augustus moet regelen

Microsoft Copilot of eigen AI: de Cloud Act-vraag

ChatGPT op het werk: mag het, en wat met je data?

AI-mailtriage: klantvragen beantwoorden met je eigen data

AI trainen op eigen bedrijfsdata: kan dat, wat kost het?

Private AI voor de zorg: veilig met je eigen dossiers

Private AI voor accountants: AVG-bewuste documentverwerking