Hoe we dit meten.
Cijfers zijn pas iets waard als je kunt nagaan hoe ze tot stand komen. Daarom leggen we elke meting hier open: welke vragen we stellen, welke sites we scannen, welke AI-systemen we ondervragen en, net zo belangrijk, wat onze metingen niet zeggen.
Dezelfde vragen, dezelfde domeinen, elke editie. Alleen dan zijn twee metingen vergelijkbaar.
Geen vertaalde Amerikaanse studies. We meten het Nederlandse web zelf, met eigen scripts.
We benoemen bron, peildatum en steekproef bij elk cijfer, plus waar de grens van de meting ligt.
AI-Citatie Index
We stellen 50 vaste Nederlandse koopvragen aan AI-assistenten, verdeeld over tien branches (vijf vragen per branche): van “welk klusbedrijf in mijn buurt is goed” tot “welke boekhoudsoftware kun je aanraden”. Het zijn precies het soort vragen die mensen vroeger aan Google stelden en nu steeds vaker aan een AI-assistent.
De vragen liggen vast en veranderen nooit: elke vraag heeft een eigen, onveranderlijk ID. Daardoor is editie op editie vergelijkbaar. Een nieuwe branche toevoegen kan, een bestaande vraag herschrijven niet, want dan zou je appels met peren vergelijken over de tijd.
Elke vraag gaat naar drie AI-systemen met live webtoegang: Claude (de hoofdmeting, waarop de branche-deepdives draaien zodat die onderling vergelijkbaar blijven), Gemini en Perplexity. Het antwoord ontleden we automatisch in de genoemde namen, de gebruikte bronnen en een samenvatting.
Elke genoemde naam classificeren we in één van vier soorten: lokaal bedrijf, landelijk bedrijf, merk of product, of platform of vergelijker. Zo kunnen we per branche meten hoe vaak een AI een écht bedrijf noemt versus een tussenpartij als Trustoo of Werkspot.
Wat dit niet zegt: het is een meting van wat de modellen op dat moment antwoorden, niet van wat elke individuele gebruiker te zien krijgt. Antwoorden variëren met formulering en personalisatie. Daarom meten we vaste vragen en kijken we naar het patroon over veel vragen, niet naar één los antwoord.
Top-500 crawler-scan
We nemen de 500 best bezochte Nederlandse domeinen (een vaste lijst, afgeleid van de openbare Tranco-ranglijst) en scannen ze technisch. De scan is volledig read-only en deterministisch: er komt geen AI aan te pas, dus twee scans van dezelfde site geven hetzelfde resultaat.
Per domein meten we:
- Welke van elf bekende AI-crawlers worden geblokkeerd in
robots.txt— onder andere GPTBot en OAI-SearchBot (OpenAI), ClaudeBot (Anthropic), Google-Extended (Gemini), PerplexityBot, Bytespider (TikTok) en CCBot (Common Crawl). - Of er een llms.txt aanwezig is (het opkomende bestand waarmee sites AI-systemen expliciet sturen) en of er een sitemap.xml is.
- Of de homepage FAQ-schema, andere gestructureerde data (JSON-LD) en tabellen bevat — signalen die AI-assistenten helpen de inhoud te citeren.
Domeinen die we niet kunnen bereiken (time-out, DNS-fout) tellen we niet mee in de percentages. Daarom rekenen we steeds over de bereikbare sites, en noemen we dat aantal er expliciet bij.
Wat dit niet zegt: een geblokkeerde crawler in robots.txt betekent dat een site zichzelf vrijwillig afsluit, niet dat AI de site nooit kan citeren via andere bronnen. En een ontbrekend FAQ-schema is een gemiste kans, geen garantie op onzichtbaarheid. We meten gereedheid, geen einduitkomst.
Vindbaarheid-tracker
We beheren zelf ruim vijftien Nederlandse websites. Via Google Search Console volgen we hoe vaak die opduiken voor AI-gerelateerde zoekopdrachten (termen als “vindbaar in ChatGPT” of “AI-vindbaarheid”) en vergelijken we een periode van 28 dagen met de 28 dagen daarvoor.
We splitsen daarbij bewust de kerncluster (onze exacte positionering) van de bredere AI-termen, zodat groei in het ene niet wordt verdoezeld door verval in het andere. Het is een meting op onze eigen sites, dus geen brede markt-uitspraak, maar wel een eerlijk kijkje in de echte beweging van zoekvraag rond AI-vindbaarheid in Nederland.
AI-citatie-check (aggregaat)
Iedereen kan zijn site gratis laten scannen met onze AI-citatie-check, die tien factoren beoordeelt (crawler-toegang, FAQ-schema, llms.txt, gestructureerde data, snelheid en meer). De geanonimiseerde, geaggregeerde uitkomsten daarvan gebruiken we als extra datapunt: de gemiddelde score van honderden Nederlandse sites.
Wat dit niet zegt: dit is een zelfselectie-steekproef (mensen die de check zelf opzoeken), dus geen representatieve doorsnede van alle NL-sites. We gebruiken het als richtingsindicator, niet als nationaal gemiddelde, en pas vanaf voldoende inzendingen.
Geen verzonnen getallen, geen overgeschreven edities.
- Elke editie blijft bewaard. Een nieuwe scan overschrijft de vorige nooit; elke meting is een losse, gedateerde editie. Zo bouwt de tijdlijn zich op zonder dat geschiedenis verdwijnt.
- Cijfers komen uit de meting, niet uit ons hoofd. Elk datapunt dat we publiceren of in artikelen verwerken, is gekoppeld aan een concrete editie met peildatum en wordt automatisch tegen de brondata gecontroleerd.
- We noemen de noemer. Percentages staan altijd met het aantal erbij waarover ze gaan (bijvoorbeeld “6 van de 393 bereikbare sites”), zodat je zelf kunt nagaan hoe hard een cijfer is.
- We bewaken de continuïteit. Een geautomatiseerde controle waarschuwt ons als een maandelijkse editie uitblijft, zodat er geen gat in de reeks ontstaat.
