De Dataloog

DTL S2A15 - Scikit-LEGO

De Dataloog
11-05-2020

Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.