AI-capaciteit kosten 2026: wat kost GPU-compute voor MKB?
Echte prijzen voor AI-rekenkracht in 2026: van 0,99 euro per GPU-uur tot een eigen server. Met een rekenmodel van GPU-uur naar maandkosten, plus de vraag of je die GPU wel nodig hebt.
/ KORT GEZEGD
Echte prijzen voor AI-rekenkracht in 2026: van 0,99 euro per GPU-uur tot een eigen server. Met een rekenmodel van GPU-uur naar maandkosten, plus de vraag of je die GPU wel nodig hebt.
Onderdeel van
AI capaciteit en computeSPOKE/AI CAPACITEIT
PUBLICATIE·30 JUNI 2026
Wie googelt op "wat kost AI capaciteit" of "GPU huren prijs" krijgt een muur van uurtarieven in dollars terug. Nul komma nul zeven dollar per uur voor de ene kaart, bijna honderd dollar per uur voor de andere. Wat zeggen die getallen over je maandrekening? Niets. En precies daar laten de GPU-marktplaatsen je staan: ze quoten een uurtarief en vertalen het nooit naar wat een MKB-bedrijf aan het eind van de maand echt betaalt. Dit artikel doet dat wel.
Anders dan onze AI Capaciteit-pagina, die bewust niet op een uurtarief leadt, geven we hier wel concrete marktprijzen. Maar we laten het daar niet bij: we vertalen die uurtarieven naar maandkosten, naar kosten-per-uitkomst, en we stellen de vraag die de hele markt overslaat: heb je die GPU eigenlijk wel nodig? Voor het bredere kader rond de drie lagen van AI-capaciteit, lees eerst het dossier AI capaciteit en compute voor Nederlandse bedrijven. Dit artikel is de prijs-verdieping eronder.
/ 01De prijsvraag
De prijsvraag onder de motorkap
Achter elke vraag "wat kost AI capaciteit" zit een directeur die wil weten of dit binnen het budget past. Niet of een H100 nou 88 of 98 dollar per uur kost, maar of zijn bedrijf hier 200 euro per maand aan kwijt is of 5.000. Die vraag wordt op het hele internet slecht beantwoord, omdat de partijen die de prijzen publiceren GPU-marktplaatsen zijn. Hun product is het uur, dus dat is wat ze tonen.
Het probleem: een uurtarief in dollars is geen maandrekening in euro. Er zit geen Nederlandse BTW op, er staat niet bij hoeveel uur je de machine echt draait, en er staat al helemaal niet bij wat beheer, opslag en dataverkeer kosten. Wie alleen op het uurtarief stuurt, koopt een getal en geen uitkomst. We pakken eerst de echte marktprijzen erbij, en vertalen ze daarna stap voor stap naar een bedrag dat je op je begroting kunt zetten.
Je betaalt niet voor een GPU. Je betaalt voor een uitkomst, en de GPU is daar maar een klein onderdeel van.Werkdefinitie · Dossier AI-capaciteit kosten
/ 02Marktprijzen
Marktprijzen 2026: wat kost een GPU-uur echt
Hieronder de prijzen zoals ze medio 2026 in de markt staan. Belangrijk vooraf: dit zijn richtbedragen, geen vast tarief van ons. De internationale bedragen staan in dollars, zonder Nederlandse BTW, en GPU-prijzen fluctueren sterk met vraag en aanbod. Lees ze als orde van grootte, niet als offerte.
| GPU-type / model | Indicatieve prijs per uur | Waar dit voor bedoeld is |
|---|---|---|
| NL-aanbieder, instap-GPU | vanaf 0,99 euro | MKB-werklasten, EU-datacenter, BTW-conforme factuur |
| RTX 3060 (marktplaats) | vanaf circa 0,07 dollar | Lichte experimenten, kleine modellen, hobby tot dev |
| V100 (marktplaats) | circa 2,55 tot 3,06 dollar | Oudere maar capabele kaart voor mid-size workloads |
| A100 (marktplaats) | circa 0,81 tot 3,67 dollar | Zwaardere inferentie, embeddings, lichte training |
| 8x H100 (marktplaats) | circa 88 tot 98 dollar | Zware training en grootschalige generatie, zelden MKB |
Twee modellen vallen buiten dit rijtje, omdat ze niet per GPU-uur rekenen. API-compute reken je af per verwerkt token of per taak: geen uurtarief, je betaalt alleen voor wat je echt gebruikt.1 En hardware kopen kent helemaal geen uurprijs, maar een investering: een GPU-workstation of server kost grofweg tussen 9.000 en 50.000 euro, en een zware H100-config loopt fors hoger op.2 Die twee zetten we in de volgende sectie naast de uurtarief-route.
/ 03Kostenmodellen
Drie kostenmodellen: API, managed, eigen hardware
Achter elk uurtarief zit een inkoopmodel, en die drie modellen verschillen vooral in hun kostenstructuur: betaal je per gebruik, per maand, of in een keer vooraf? Dat onderscheid bepaalt je begroting meer dan welk specifiek getal dan ook. We kijken hier puur naar de kostenkant; de stroom- en aansluit-kant van eigen hardware behandelen we apart in de netcongestie-spoke.
| Aspect | API-compute | Managed capaciteit | Eigen hardware |
|---|---|---|---|
| Kostenstructuur | Per gebruik, geen vaste kosten | Vast budget-bandje per maand | Investering plus exploitatie |
| Startbedrag | Geen, je betaalt achteraf per taak | Maandbedrag vooraf afgesproken | 9.000 tot 50.000 euro plus |
| Schaalt mee met gebruik | Ja, automatisch op en neer | Binnen de gereserveerde band | Nee, je betaalt de capaciteit hoe dan ook |
| NL-BTW-conforme factuur | Via NL-partner mogelijk | Via NL-partner mogelijk | Ja, bij NL-leverancier |
| Past bij | De meeste MKB-werklasten | Voorspelbaar, doorlopend zwaar werk | Heel hoog volume of strikte datasoevereiniteit |
Voor het overgrote deel van het MKB is de eerste rij de juiste keuze. API-compute heeft geen vaste lasten, schaalt automatisch mee en kan via een Nederlandse partner met een BTW-conforme factuur en verwerkersovereenkomst worden afgenomen. Managed capaciteit wordt pas interessant bij voorspelbaar, doorlopend zwaar werk, en eigen hardware pas bij heel hoog volume of een harde eis dat data het pand niet uit mag.
Een uurtarief vergelijken is makkelijk. Een kostenmodel kiezen dat bij je werkproces past, is de beslissing die je rekening bepaalt.Kernboodschap · van uurtarief naar uitkomst
/ 04Uur naar maand
Van GPU-uur naar maandbedrag: het rekenmodel
Dit is het rekenmodel dat geen enkele GPU-marktplaats je geeft, terwijl het de enige som is die er voor je begroting toe doet:
Maandkosten = uurtarief maal draaiuren per maand.
Een maand heeft ongeveer 730 uur. Neem een A100 op 2 euro per uur en zet hem permanent aan: 2 euro maal 730 uur is circa 1.460 euro per maand, kaal. Dat is exclusief beheer, opslag, dataverkeer en de uren waarin de kaart staat te draaien zonder iets nuttigs te doen. Reken je met het zwaardere uiteinde van de A100-range, dan loopt het kale bedrag richting 2.500 euro per maand. Zo wordt een "goedkoop" uurtarief opeens een serieuze vaste last.
Het echte inzicht zit in de herkadering. Stop met rekenen in euro per uur en begin met rekenen in euro per uitkomst: wat kost het om een maand lang de mailstroom te triageren, of om de offerte-voorbereiding van een verkoopteam te ondersteunen? Dat bedrag is voorspelbaar, het uurtarief van een losse GPU niet. Wij sturen daarom op budget-bandjes per werkproces, een aanpak die we in het bredere cost-control-kader van het dossier verder uitwerken.
/ 05Scenarios
Drie scenarios: klein, middel, zwaar
Theorie wordt pas bruikbaar met concrete gevallen. Drie typische MKB-scenarios, met een indicatieve orde van grootte per maand. Nogmaals: richtbedragen om mee te denken, geen vaste offerte.
Klein: mailtriage en documentvragen
Een installatiebedrijf wil de support-mail laten voorsorteren en veelgestelde vragen automatisch laten beantwoorden. Dit draait volledig op API-compute; er is geen eigen GPU nodig. De compute-kost zelf is typisch laag, vaak onder de paar honderd euro per maand. Het meeste budget zit niet in de rekenkracht maar in de inrichting en het beheer van het werkproces.
Middel: offerte-prep en RAG op productdocumentatie
Een technische groothandel wil offertes laten voorbereiden en zijn productdocumentatie doorzoekbaar maken met bronverwijzing. Dat draait op API-compute, met af en toe een managed GPU voor het bouwen van de embeddings over de documentenset. De maandlast ligt hoger dan bij het kleine scenario, maar de zware GPU is een korte, periodieke kostenpost en geen permanente machine.
Zwaar: continue generatie of grote transcriptie-batches
Een bureau dat doorlopend beeld of video genereert, of grote hoeveelheden audio transcribeert, zit in het zware scenario. Hier wordt managed GPU of zelfs een eigen machine relevant, en kan een business-case voor eigen hardware kantelen, mits het volume hoog en voorspelbaar is. Dit is het enige van de drie scenarios waarin het GPU-uurtarief je grootste post wordt.
0
AGENTS IN PRODUCTIE
0
SERVERS LOKAAL+CLOUD
0%
COMPUTE-AANDEEL IN COST
0
EIGEN GPU-CLUSTERS
/ 06Verborgen kosten
De verborgen kosten die GPU-marktplaatsen niet noemen
Het uurtarief is de kop boven de advertentie. De rekening bestaat uit veel meer posten, en die staan zelden in beeld als je een kaart huurt:
- Idle-tijd. Bij een gehuurde machine betaal je vaak ook de uren dat de kaart aanstaat zonder werk. Dat is precies waar het uurtarief-denken duur wordt.
- Dataverkeer en opslag. Het wegschrijven en ophalen van data (egress) en het bewaren van modellen en datasets lopen apart op de factuur.
- Beheer en monitoring. Iemand moet de machine inrichten, draaiend houden en in de gaten houden. Die uren staan op geen enkele marktplaats-prijs.
- Geen NL-conforme factuur of verwerkersovereenkomst. Een dollarbon zonder BTW en zonder verwerkersovereenkomst kost je administratie en compliance later tijd en geld.
- Stroom en aansluiting bij eigen hardware. Koop je een eigen server, dan komt het stroomverbruik erbovenop, en sinds 1 juli 2026 staat ook het MKB op de wachtlijst voor een zwaardere netaansluiting. Die kostenpost werken we uit in de netcongestie-spoke.3
Het uurtarief is de kleinste post op de rekening. De echte vraag is wat het hele werkproces per maand kost, idle-tijd en beheer inbegrepen.Inzicht · total cost of ownership
/ 07GPU nodig?
De vraag die niemand stelt: heb je die GPU wel nodig?
Dit is de blinde vlek van vrijwel elke prijsvergelijker: ze beantwoorden de vraag "welke GPU huur ik" zonder eerst te vragen of je er een nodig hebt. Voor circa 90 procent van de MKB-toepassingen is dat antwoord namelijk: geen. Mailtriage, offerte-voorbereiding en documenten doorzoeken draaien prima op API-compute met een goed opgezette agent-architectuur. De duurste fout die we zien, is een GPU huren of kopen voordat een werkproces er concreet om vraagt.
De keuze gaat dus niet als eerste over een kaart, maar over wat je wilt opschalen: je rekenkracht of je mensen. Wil je minder handwerk per persoon, dan is het antwoord bijna altijd een agent op normale compute, niet een GPU. Het volledige beslismodel daarvoor, met de twee capaciteit-curves, staat in de spoke wanneer GPU's en wanneer agents. Die spoke geeft bewust geen prijzen; dit artikel doet dat, en samen beantwoorden ze de hele vraag.
/ 08Volgende stap
Drie volgende stappen
Je kent nu de marktprijzen, het rekenmodel en de eerlijke vraag of een GPU nodig is. Drie concrete stappen, van breed naar specifiek:
- Lees het volledige dossier. De pillar AI capaciteit en compute voor Nederlandse bedrijven legt de drie lagen uit waarin capaciteit geleverd wordt en waar deze prijzen in passen.
- Bepaal of je compute of mensen wilt opschalen. De beslis-spoke wanneer GPU's en wanneer agents geeft het model om die keuze te maken voordat je over een uurtarief praat.
- Plan een capaciteits-gesprek. Bekijk hoe wij capaciteit leveren: 30 minuten, een eerlijke kosten-inschatting per werkproces, geen uurtarief-discussie. Reactie binnen 24 uur na het intake-formulier.
BRONVERMELDINGEN
- 01Marktcontext, claim over de markt: Nederlandse GPU-verhuur vanaf circa 0,99 euro per uur (EU-datacenters, BTW-conform); internationale marktplaatsen tonen RTX 3060 vanaf circa 0,07 dollar, V100 circa 2,55 tot 3,06 dollar, A100 circa 0,81 tot 3,67 dollar en 8x H100 circa 88 tot 98 dollar per uur. Bedragen in dollars zonder NL-BTW, sterk fluctuerend. Geen vast tarief van MKB Compute. Bron: openbare prijsoverzichten van GPU-verhuur (vast.ai en vergelijkbare aanbieders), geraadpleegd 2026-06. vast.ai
- 02Marktcontext, claim over de markt: een GPU-workstation of -server voor zakelijk gebruik kost grofweg tussen 9.000 en 50.000 euro, een zware H100-configuratie loopt fors hoger op. Richtbedragen 2026, afhankelijk van configuratie en leverancier; geen aanbod van MKB Compute.
- 03Per 1 juli 2026 vallen ook kleinverbruikers en MKB tot 3x80A onder het maatschappelijk prioriteringskader van de ACM voor de wachtlijst van stroomaansluitingen, waardoor een zwaardere aansluiting voor eigen AI-hardware een trager traject wordt. Bron: KVK, netcongestie voor je bedrijf. www.kvk.nl
OVER DE AUTEURS
Oprichter
Bouwt en runt MKB Compute samen met Tom. Verantwoordelijk voor operations, agent-orkestratie en klant-implementatie.
Oprichter
Bouwt en runt MKB Compute samen met Milan. Verantwoordelijk voor sales, klant-relatie en technische architectuur.
/ FAQ/VEELGESTELDE VRAGEN
Wat je waarschijnlijk wil weten.
Veelgestelde vragen over dit onderwerp.
Q01
Wat kost een GPU huren in 2026?
Bij Nederlandse aanbieders begint GPU-verhuur rond 0,99 euro per uur, op internationale marktplaatsen vanaf circa 0,07 dollar per uur voor lichte kaarten tot enkele euro's voor een A100. Reken die uurprijs door naar een maandbedrag, want het kale uurtarief is de kleinste kostenpost.
Q02
Wat kost AI-capaciteit per maand?
Dat hangt af van het werkproces. Lichte werklasten zoals mailtriage draaien op API-compute en blijven vaak onder de paar honderd euro per maand. Zware, continue workloads op managed GPU lopen op tot duizenden euro's. Op onze 57 agents zit compute onder 8 procent van de operationele kosten.
Q03
Huren of een eigen AI-server kopen?
Voor de meeste MKB-werklasten huren. Een eigen GPU-server kost tussen 9.000 en 50.000 euro plus stroom, koeling en beheer, en sinds 1 juli 2026 ook een wachtlijst voor een zwaardere netaansluiting. Eigen hardware loont pas bij heel hoog, voorspelbaar volume of harde eisen aan datasoevereiniteit.
Q04
Heb ik wel een GPU nodig?
Voor ongeveer 90 procent van de MKB-toepassingen niet. Mailtriage, offerte-voorbereiding en documenten doorzoeken draaien prima op API-compute met een goede agent-architectuur. Een GPU huren of kopen voordat een werkproces erom vraagt, is een van de duurste fouten die we zien.
Q05
Waarom geen vast uurtarief voor compute?
Omdat een uurtarief de verkeerde vraag is. Wij rekenen met budget-bandjes per maand of per werkproces en sturen op kosten-per-uitkomst, niet op losse GPU-uren. Zo weet je vooraf wat een werkend resultaat per maand kost, zonder verrassingen op een factuur in dollars.
VOLGENDE STAP/AI CAPACITEIT
Plan een capaciteits-gesprek van 30 minuten. Binnen 24 uur reactie.
We luisteren naar je workload, schetsen welke laag het meest oplevert en geven een eerlijke kosten-inschatting.
VERDER LEZEN IN HETZELFDE DOSSIER
Meer uit AI capaciteit en compute.
PILLAR·23 min
AI-capaciteit en compute: wat heb je als bedrijf nodig?
Waarom 'AI capaciteit' niet alleen GPU's is, hoe agents en workflow daarbij horen, en hoe je voor jouw werkload kiest tussen API, managed GPU of eigen hardware.
Lees verder →VELDVERSLAG·9 min
AI capaciteit huren: wanneer GPU's en wanneer agents
Het belangrijkste beslismoment in AI capaciteit: vermenigvuldig je compute of vermenigvuldig je mensen. Een eerlijk beslismodel voor MKB.
Lees verder →VELDVERSLAG·10 min
AI-capaciteit zonder eigen datacenter: MKB en netcongestie
AI vraagt stroom en het net zit vol. Per 1 juli 2026 komt ook het MKB op de wachtlijst voor een zwaardere aansluiting. Zo koop je compute in zonder de wachtrij.
Lees verder →