Aan de slag met data analytics (4) – Hoe laten we het gebeuren?
We zijn aangekomen bij de vierde en laatste blog in de serie over data analytics. In de vorige drie blogs nam Johnny van Cadsand ons mee in het verhaal over descriptive, diagnostic en predictive analytics. Hiermee kan een organisatie verklaren wat er is gebeurd, waarom het is gebeurd en wat er kan gaan gebeuren. De laatste, ultieme stap in data analytics is prescriptive analytics. Hierin gaan we op zoek naar de vraag hoe laten we het gebeuren?
Voor deze laatste blog heeft Johnny de pen overhandigd aan Joep Verbeeten, hij is een van onze meest ervaren consultants en specialist op dit onderwerp. Joep droomt zelfs over dit type data analytics en licht de laatste stap graag toe.
Wat is prescriptive analytics?
Er is veel geschreven over wat prescriptive analytics is en hoe het werkt. Ik zal hier een korte uitleg geven die zeker niet alles omvat, maar zo krijg je een beeld van de basis.
Prescriptive analytics is de ultieme stap met betrekking tot analytische mogelijkheden. Het is gebaseerd op big data, data mining en artificial intelligence, in de vorm van machine learning – het vermogen van een computerprogramma om zonder menselijke input gegevens te begrijpen en zelflerend te worden. Belangrijk om te vermelden bij machine learning modellen is dat het meestal blackboxen zijn. Dit betekent dat je er data in kan stoppen maar dat het moeilijk is om te achterhalen hoe het programma precies aan de uitkomsten komt.
De data die in de modellen wordt gestopt is groot en divers, het bestaat uit gestructureerde (cijfers, categorieën) en ongestructureerde data (video’s, afbeeldingen, geluiden, teksten). Hier begint de transitie van datawarehouse naar data lake. Een groot voordeel hiervan is dat de ongestructureerde data gebruikt kan worden om onderlinge relaties bloot te leggen waarvan het bestaan niet of nauwelijks bekend is. Kortom: een data lake zorgt voor complexere analyses en kan mogelijke problemen en oplossingen identificeren waar je met gestructureerde data nooit op had kunnen komen.
De data die in het model wordt gestopt wordt gecombineerd met bedrijfsregels om te voorspellen wat ons te wachten staat en om aanbevelingen te geven over hoe we kunnen profiteren van deze voorspelde toekomst. Het ‘prescriptive’ zit ‘m dan ook in het feit dat het systeem voor jou bepaalt, jou ‘voorschrijft’, wat de vervolgstappen zouden moeten zijn.
Wat kan je met prescriptive analytics?
Google’s zelfrijdende auto is een veel gebruikt voorbeeld van prescriptive analytics in actie. Het voertuig maakt miljoenen berekeningen tijdens elke rit die de auto helpt te beslissen wanneer en waar te draaien, wanneer te remmen, gas te geven en van baan te wisselen – dezelfde beslissingen die een bestuurder neemt.
Deze vorm van analyse wordt ook gebruikt in cybersecurity om onderscheid te maken tussen legitieme en kwaadaardige activiteiten en het signaleren van bijvoorbeeld creditcardfraude. In retail wordt prescriptive analytics ook toegepast. Amazon start met anticiperende verzending. Zij verzenden producten naar hubs in de buurt van klanten voordat deze daadwerkelijk gekocht worden op basis van hun gedrag op het platform van Amazon. Dit kan leiden tot zeer snelle levertijden.
Ook voor medische diagnoses wordt prescriptive analytics gebruikt, zo kunnen artsen verschillende soorten kanker diagnosticeren door onderscheid te maken tussen sterk invasieve kankercellijnen, en minder invasieve lijnen met alleen informatie over de celvorm. Laat mij dit voorbeeld gebruiken om aan te geven hoe je deze machine learning modellen traint.
Een medisch expert beoordeelt afbeeldingen van cellen en koppelt daar een diagnose aan (wel of geen kanker cel). Vervolgens worden duizenden van deze afbeeldingen aan het model voorgelegd. Het model zoekt overeenkomsten tussen de foto’s met kankercellen en stelt op basis daarvan een diagnose criterium in bij nieuwe foto’s. Wat deze criteria zijn is (meestal) onbekend. Elke nieuwe foto die wordt voorgelegd aan het model zal dan aan de hand van deze criteria worden gediagnostiseerd.
Wanneer is mijn organisatie klaar voor prescriptive analytics?
Deze laatste stap in data analytics zal voor veel sectoren (nog) niet interessant zijn. Op het moment werken slechts enkele organisaties met prescriptive analytics.
Het is een dure manier van analyseren, niet elke organisatie zal dus in staat zijn om dit financieel te verantwoorden. Ook zorgt het voor de nodige verandering in een organisatie, een business intelligence expert kan dit er niet ‘even’ bij doen. Het is een op zichzelf staande discipline, hiervoor zullen medewerkers moeten worden bijgeschoold of aangenomen. Vaak wordt de rol van data scientist hierbij genoemd.
Bij predictive analytics werden al ethische vragen gesteld, deze ethische kwesties gaan bij prescriptive analytics een flinke stap verder. Er kan bijvoorbeeld niet worden achterhaald hoe bepaalde beslissingen zijn genomen.
Toch is het belangrijk om te realiseren dat dit wel de toekomst is en dat het dus zinnig kan zijn alvast kennis van deze stap in data analytics op te bouwen.