Hocus pocus, iedereen kan toveren!
Vroeger was me dat toch moeilijk! Tsjonge, alleen de allerdichtstgetikte nerds konden uit de voeten met de tools die dingen als “business intelligence” en “machine learning” voor je uitvoerden. Matrix-achtige zwarte schermpjes waar groene nummers overheen razen. Vingers die minstens zo snel over een toetsenbord vliegen en een bril die langzaam steeds verder van de neus van de aandoenlijke whizkid afglijdt. Programmeren in obscure omgevingen brengt de toch al vervreemde geek ieder
uur een beetje verder weg uit de realiteit.
Nu is dat heel anders. Iedereen kan het. Je hoeft maar een computer, of zelfs alleen een tablet te hebben. Download even de hipste app, schraap ergens een nuttig datasetje vandaan en hoppa, gaan met die banaan. De wereld ligt aan je voeten. Regressiemodellen, decision trees, generalized linear models, neurale netwerken, je kan het zo gek niet bedenken of er bestaat wel een knopje voor. Data erin, knopje induwen, even wachten en je weet hoe de wereld werkt.
Laat die mensen maar op je website binnenstromen, je producten kopen of met open mond van verbazing jouw op-ed lezen over hoe de wereldhonger bestreden moet worden. Google gebruikt deze technieken ook, dus wat kan er mis gaan? Als alle succesvolle high-tech bedrijven deze data-tovenarij gebruiken, waarom zou jij dan niet? Succes gegarandeerd. En dat weet je baas ook. Vooral de CEO die door de verkopers van deze uiterst gebruikersvriendelijke softwarepaketten is ingepakt wil zo snel mogelijk resultaat zien van zijn/haar nieuw ingericht data analytics expertise centrum.
Het allermooiste aan deze, volledig op de niet zo computervaardig onderlegde gebruiker toegespitste “Big data” programma’s is dat ze altijd een antwoord geven. Het maakt niet uit hoe bagger je model, het maakt niet uit of de data ook maar iets met je vraag te maken heeft. Er volgt altijd een antwoord.
Shit in, shit out. Wat teveel mensen zich niet realiseren is dat het feit dat je hippe algoritme een antwoord uitspuugt niet direct betekent dat dat antwoord ook ergens op slaat. Heb je geen verstand van de achterliggende modellen dan zit je jezelf voor te liegen en produceer je poep. Bijna iedereen kent de leus “je model of voorspelling is op z’n best zo goed als de data die je erin stopt”. Mogen we dat even uitbreiden tot “je model of voorspelling is op z’n best zo goed als de data die je erin stopt en de analist die het maakt”? Laat het alsjeblieft aan de pro over, zodat de stijgende lijn aan statistische nonsense in de media zo gauw mogelijk de nek om wordt gedraaid.