De Dataloog

DTL– Big Data Expo special 8 – Het belang van onzekerheid bij ML modellen

De Dataloog
07-10-2019

Data science-producten algoritmes voorspellingen: op het plaatje staat een kat; deze website bezoeker zal een advertentie voor product X kopen; de waarde van dit huis is € 250.000. Door een reeks informatie samen te vatten in één eenvoudige voorspelling, wordt de informatie bruikbaar: we kunnen de juiste advertentie op het juiste moment weergeven en we weten voor welke prijs we ons huis op de markt moeten brengen. Machine learning algoritmes leveren ons punt schattingen (getallen of klassen). Voorspellingen worden echter nooit met 100% zekerheid gegeven. De uitkomt van een puntschatting komt met een distributie van onzekerheid. Deze distributie zien we echter niet, waardoor algoritmes een schijnzekerheid geven! Sterker, zelfs als de uitkomst van een algoritme onzeker is krijg je alsnog een uitkomst. Moeten we dat willen in bijvoorbeeld de healthcare sector? Zouden we niet liever “geen uitkomst” willen geven als een voorspelling te onzeker is? We gaan in gesprek met Lieke Kools en Richard Bartels over het belang van onzekerheid in ML modellen. We praten over hoe we data scientists en eindgebruikers hiermee moeten leren omgaan.
Zie verder https://vantage-ai.com/nl/ https://www.dedataloog.nl en het blog op de website van Big Data Expo https://www.bigdata-expo.nl/nl/beyond-point-estimates-importance-uncertainty-machine-learning
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.