Table of Contents

    Je AI-tools zijn zo goed als jouw data

    Stapels overvolle mappen en dossiers in een houten archiefkast, symbool voor de administratiedruk die Lumans met AI-oplossingen wegneemt.

    Leestijd: 4 minuten

     

    Je AI is zo goed als jouw data

    Stel je voor: je organisatie implementeert een AI-tool om klantbehoefte te voorspellen. De tool werkt vlot, geeft snelle inzichten en klinkt overtuigend. Drie maanden later blijkt dat een kwart van de klantprofielen al anderhalf jaar niet is bijgewerkt. De AI werkte prima. Op de verkeerde basis.

    Dit is geen uitzonderlijk geval. Het is de meest onderschatte reden waarom AI-projecten teleurstellen: niet de technologie, maar de data waarop ze draaien. En hoe krachtig een AI-model ook is, het kan nooit beter zijn dan de informatie die het krijgt.

     

    Garbage in, garbage out (maar nu op schaal)

    De uitdrukking “garbage in, garbage out” is zo oud als de informatica zelf. Toch krijgt ze vandaag een geheel nieuwe lading. Vroeger verwerkte een slecht gevoed systeem misschien een rapport fout. Nu neemt een AI-agent zelfstandig beslissingen op basis van duizenden datapunten per minuut.

    Fouten reizen mee, maar dan sneller. Een verouderd contactpersoon in je CRM leidt tot een e-mail naar iemand die al twee jaar niet meer bij het bedrijf werkt. Een interne tool die werkt met onvolledige kostendata geeft je een verkeerde aanbeveling voor de volgende investering. En bij AI-agents die zelfstandig handelen, zijn de gevolgen er voordat iemand heeft kunnen ingrijpen.

     

    Uit een onderzoek van Gartner (2025) bleek dat slechte datakwaliteit organisaties gemiddeld 12,9 miljoen dollar per jaar kost. Niet door spectaculaire fouten, maar door kleine slipjes die zich opstapelen.

     

    De drie meest voorkomende dataproblemen in de praktijk

    1. Verouderde data

    Data heeft een houdbaarheidsdatum. Mensen wisselen van functie, bedrijven verhuizen, projecten eindigen. Als je AI werkt met een klantendatabase die twee jaar geleden voor het laatst is opgeschoond, werkt ze eigenlijk met een snapshot uit het verleden. Hoe recenter je data, hoe relevanter de uitkomsten.

    2. Inconsistente data

    Afdeling A schrijft “B.V.”, afdeling B schrijft “BV” en het systeem van de boekhouding kent het bedrijf als “bv.”. Voor een mens zijn dit dezelfde organisatie. Voor een AI zijn het drie verschillende entiteiten. Inconsistente naamgeving, wisselende datumformaten en dubbele records zijn stille saboteurs van elk AI-project.

    3. Incomplete data

    Ontbrekende velden zijn een groter probleem dan ze lijken. Een AI die patronen zoekt, trekt ook conclusies uit wat er niet is. Als bij 30% van je klanten geen sector is ingevuld, gaat het model ervan uit dat dit niet relevant is. Of erger: het vult de lege waarde zelf in met een aanname.

     

    Lees ook: Shadow AI: de onzichtbare AI in jouw organisatie

     

    Wat de EU AI Act hierover zegt

    Tegen augustus 2026 is de EU AI Act volledig van kracht. Een van de minder bekende, maar concrete eisen: organisaties die AI inzetten voor high-risk toepassingen moeten kunnen aantonen dat hun trainingsdata en invoerdata van voldoende kwaliteit is. Niet als eenmalige check, maar als doorlopend proces.

    Dat betekent dat datakwaliteit niet langer iets is voor de IT-afdeling alleen. Het is een compliancevraagstuk. En voor organisaties die nog geen beleid hebben rondom data governance, tikt de klok.

     

    Wie is er verantwoordelijk als AI een fout maakt op basis van slechte data?

    Dat is precies de vraag die organisaties het liefst uitstellen. Maar het antwoord is simpel: jijzelf. De AI is geen rechtspersoon. Het model heeft geen intentie. Als een beslissing verkeerd uitpakt omdat de data niet klopte, kijkt iedereen naar de organisatie die het systeem heeft ingezet.

    Dit verandert hoe je naar datakwaliteit moet kijken. Het is geen technisch probleem dat je eenmalig oplost. Het is een organisatorische verantwoordelijkheid die vraagt om heldere eigenaarschap, periodieke audits en een cultuur waarin medewerkers fouten in data durven te melden.

     

    Lees ook: AI levert nu al ROI op, maar de echte winst zit vaak niet in “tijd besparen”

     

    Begin bij het doel, niet bij de data

    De meest gemaakte fout bij dataopschoning? Beginnen met alles opschonen. Dat klinkt grondig, maar het is tijdrovend, duur en vaak onnodig. De betere aanpak is andersom: begin bij wat je wilt bereiken met AI, en werk dan terug naar welke data daarvoor nodig is.

    Wil je klantverloop voorspellen? Dan heb je contractdata, gebruiksfrequentie en supporthistorie nodig, maar geen adresgegevens uit 2018. Wil je inkoopkosten optimaliseren? Dan is leveranciersdata het startpunt, niet je personeelsplanning.

    Dit is precies hoe wij bij Lumans te werk gaan. Voordat we ook maar een cel aanraken, stellen we samen de vraag: wat wil je met AI bereiken? Dat doel bepaalt welke data relevant is, welke kwaliteitseisen gelden en waar je energie in steekt. Zo voorkom je dat je maanden bezig bent met data die je AI-toepassing uiteindelijk helemaal niet nodig heeft.

    Vier stappen om je data AI-klaar te maken

    1. Bepaal eerst je doel. Wat wil je met AI bereiken? Wees concreet: niet ‘meer inzicht’, maar ‘ik wil weten welke klanten binnen drie maanden afhaken’. Dat doel stuurt alles wat daarna komt.
    2. Breng de relevante databronnen in kaart. Welke systemen bevatten de data die je voor dit doel nodig hebt? Denk aan je CRM, ERP, projectmanagementsoftware of interne databases. Wat zit er in, en wanneer is het voor het laatste bijgewerkt?
    3. Start een gerichte datakwaliteitsaudit. Focus alleen op de data die jouw AI-toepassing daadwerkelijk voedt. Controleer op duplicaten, ontbrekende velden en verouderde records in die specifieke databronnen, niet in alles tegelijk.
    4. Maak data-hygiëne een vast proces. Niet eenmalig opschonen, maar een ritme inbouwen. Kwartaalchecks, automatische validatieregels bij invoer en een duidelijk protocol voor medewerkers die fouten signaleren.

     

    Kleine organisatie, grote kans

    Juist voor kleine en middelgrote organisaties biedt dit een voordeel. Je hebt minder data, minder systemen en minder silo’s. Dat betekent dat je sneller kunt opschonen en sneller kunt zien waar het misgaat. Grotere bedrijven worstelen met legacy-systemen en afdelingen die elk hun eigen databeheer hebben.

    Begin vandaag met de vraag: wat wil ik bereiken met AI, en welke data heb ik daarvoor nodig? Die volgorde maakt het verschil.

     

    👉 Klaar voor de volgende stap?
    Bij Lumans helpen we bedrijven en professionals om AI begrijpelijk en praktisch in te zetten, inclusief het eerlijk en doelgericht structureren van data. Plan een vrijblijvend adviesgesprek of ontdek onze diensten.