'En dan heb je ook nog de kluskabouter, die weet heel veel van de data, maar je moet niet vragen hoe die zijn technische oplossing in elkaar klust.' Deze opmerking aan de lunchtafel bleef door mijn hoofd spoken.
Zelf was ik de week ervoor naar het BI&IM symposium geweest. Daar werd uitgebreid gesproken over de ‘business bi’er’ van de toekomst: de data scientist. De scientist is het voorbeeld van de ervaren selfservice bi’er. Wil zelf alleen maar toegang tot de data en heeft zijn tools om daar heel flexibel mee te werken/queryen/analyseren. En de één zal zweren bij specieke visualisatie tools, maar vaker zal lekker met Excel gewerkt worden. Voor mij was die data scientist de kluskabouter waaraan gerefereerd werd.
De typering kluskabouter was een goed voorbeeld van de kloof tussen de business en de traditionele bi’er bij it. En die kloof kan de komende jaren wel eens sneller groeien dan dat de it-bi’er zich kan aanpassen. Want de business gaat verder en de it-bi’er zal moeten accepteren dat de gemiddelde kluskabouter steeds meer onafhankelijk wil zijn en zal worden ten opzichte van de it-afdeling. En de it-bi’er was zo gewend voor zijn gebruikers te zorgen (lees te denken), dat het wennen is dat de gebruikers nu ook in oplossingen gaan denken. En vooral als die klusser onorthodox en kort door de bocht gaat denken, begint het pijnlijden in de samenwerking. Want ‘hoe krijgt de gebruiker dit nu weer verzonnen…….amateurs’, zal menig it-bi’er niet vreemd in de oren klinken.
Gaat elke business-bi’ er zich zo ontwikkelen? Ik denk het niet. Er zullen nog genoeg gebruikers zijn die gewoon een regulier rapport nodig hebben om hun werk te kunnen doen. En daarvoor lekker willen leunen op de reguliere it-bi’er. En ook de big data analyses zullen aan andere randvoorwaarden moeten voldoen, dan analyses op een gestructureerd data warehouse, want er zijn aandachtsgebieden waar kwaliteit belangrijker is dan snelheid van de data. Maar dat de businessgebruikers het bi-domein meer en meer gaan overnemen van de it’er is een ontwikkeling die al een paar jaar loopt en de komende jaren alleen maar doorpakt.
Daarom zal de bi’er de transformatie moeten doormaken om ook als coach naar de businessgebruikers op te treden. Het is namelijk niet zo dat de businessgebruiker niet netjes, volgens een aanpak/architectuur kan werken. Het kost hem alleen teveel van zijn waardevolle tijd om zich erin te verdiepen en kiest daarom sneller voor herkenbaar en makkelijk. Dat dit soms tot inefficiënte manieren van werken kan leiden, die over de lange termijn veel meer tijd kosten, is een direct gevolg van die aanpak. Als op de korte termijn het gewenste rapport of analyse maar beschikbaar is. En hoe ga je dat in goede banen leiden? Zoals een goed Engelstalig spreekwoord zegt, ‘If you can’t beat them, join them!’.
Wen er maar vast aan, de kabouters komen er aan…
De IT-afdeling zal zich steeds meer moeten richten op het beschikbaar stellen van een betrouwbare en gebruikersvriendelijke semantische laag waaruit de gebruiker met zijn eigen tools zijn informatie kan ontsluiten. Niet iedere gebruiker is met dezelfde tool te bedienen, laat de gebruiker vooral zelf hierin kiezen.
Als IT-afdeling ben je meestal ook niet in staat om nieuwe rapportage verzoeken te leveren met de snelheid en op het moment dat de gebruiker dit wil. Je loopt bijna altijd achter de feiten aan, en het is veelal nog duurder ook. Laat de gebruiker daarom vooral zijn eigen informatie producten samenstellen, en zorg als IT-afdeling dat je uitblinkt in het leveren van data in een eenvoudig te ontsluiten omgeving.
Het artikel is herkenbaar, maar nog steeds geschreven vanuit de optiek van ‘iemand van de it-afdeling’. Zelf bekijk ik de situatie meer vanuit de optiek van een data-analist / statisticus.
Begrijp me goed, “de ICT-afdeling” is over het algemeen goed in het doen van routinewerk; en je kan het vergelijken met de spoorwegen. Beide zijn goed in het volgens lang vantevoren vastgestelde protocollen en dienstregelingen dag in dag uit bieden van een redelijk betrouwbare en redelijk dekkende service.
Maar waar ze niet goed in zijn is flexibiliteit en dienstverlening op maat naar gelang de (steeds wisselende) behoeften aan data analyse.
Meestal wil je echter verder dan het station en dan heb je voor- of natransport nodig anders dan het spoor.
Bovendien missen verreweg de meeste ICT’ers die ik ben tegengekomen basiskennis van en vaardigheden op het gebied van data-analyse, om nog maar te zwijgen van de iets meer geavanceerde technieken zoals PCA, ANOVA, regressiemodellen, log-lineaire modellen, hazard modellen, churn rate modellen, segmentatie analyses, chi-square classification trees, tijdreeks analyse modellen, of prognosemodellen die gebruikt worden.
Om die reden zie ik een duidelijke taakverdeling: ICT’ers vooral als toeleverancier van infrastructuur (connectiviteit), capaciteit (opslag en processing), beveliging (toegang, backups), en grondstof (schone data; hetzij procesdata hetzij geaggregeerde data), op basis waarvan waarmee ik problemen analyseer die te maken hebben met sturing van het bedrijf. Gewaardeerde collega’s en toeleveranciers die ICT’ers, maar slechts in beperkte mate partners.
Zo heb ik bijvoorbeeld ook mijn eigen eisen t.a.v. wat voor gereedschap ik nodig heb. Wat software tools betreft ben ik redelijk flexibel: Excel is overal wel en verder een statistisch pakket. Dat mag SAS, SPSS, of R zijn maar een van de drie is nodig. Heel soms moet er een tijdkritische bewerking gebeuren, en meestal moet dat dan als een plug-in voor R, SPSS, of SAS. Dat doe ik dan meestal zelf (in C of C++), omdat de ICT afdeling daarvoor niet geequipeerd is, of het duurt allemaal veel te lang.
Verder heb ik meestal leestoegang nodig tot een DBMS waar de gegevens instaan, waarbij ik zelf interactief queries schrijf en uitvoer en nieuwe tabellen aanmaak. Natuurlijk wel apart van de productie-omgeving, maar het moet er wel zijn. Hoe dat geregeld wordt mag de ICT afdeling weten, als het maar werkt.
Mocht later blijken dat een door mij opgestelde rekenprocedure of rapportage in de normale productie moeten worden, dan komt weer die ICT afdeling in beeld om dit netjes te analyseren, ontwerpen, bouwen, documenteren, integreren in de productie-omgeving, en uit te voeren.
De eigenlijke analyses echter zijn specialistenwerk; ICT’ers en dataanalisten zijn niet uitwisselbaar.
Dit wordt een boeiende discussie 😉 De crux achter de “Datascientist” is dat hij onderdeel is van de business, van een primaire of ondersteunend proces. Daar voegt hij zijn waarde toe door patroonherkenning,etc en kan verandering kan legitimeren. Hij gebruikt zijn tools als een pen. Het draait hem op de data. De uitdaging van een BICC is dus om de “T” even op zij te zetten en beter die voor de klant zo relevante “I” te gaan begrijpen (=bezielen). Dat maakt een BICC echt #Klantgedreven.
Ik herken de reactie van A.nalist en dat sluit ook aan bij mijn ideeën waarop ik mijn bijdrage heb gebaseerd.
Het gaat er inderdaad juist om dat de reguliere IT’er vooral ingesteld is op structuur, doordachte kwaliteit, enz. En dat de data scientist op zoek is naar creatieve, snelle, flexibele, enz. oplossingen.
Maar er gaan dermate veel data scientisten opstaan, dat we die tegenstelling tussen de twee bloedgroepen niet moeten willen laten bestaan. Het is juist zaak dat we elkaar moeten leren begrijpen. En dat betekent dat de IT’er de data scientist moet leren begrijpen en ondersteunen. Maar dat betekent ook dat de data scientist er niet meer mee weg komt om alleen maar zichzelf tegen IT af te zetten. Er zal vanuit de scientist ook begrip moeten komen voor de ideeën van de IT’er.
En als ze elkaar echt weten te vinden, dan gaan er mooie dingen ontstaan.
Bij de term “data scientist” denk ik meer aan de statisticus die BI tools / data gebruikt en combineert met andere gegevens om (geavanceerde) analyses te kunnen maken (Het beeld dat ook naar voren komt in de reactie van A.nalist). Let wel dat dit om een, meestal beperkte, groep van gebruikers gaat, die zelf ook weer in een ondersteunende rol werkzaam zijn.
Wel is het zo dat een steeds grotere groep aan business gebruikers de behoefte aan een hoge mate van self-service, waarbij ze snel zelf informatie oplossingen (analyses, rapporten etc.) kunnen creëren zonder dat daar een “IT”-vertaalslag tussen zit. De gekozen architectuur en inrichting van BI speelt hierbij een belangrijke rol. Deze bepaalt immers de mate van van self-service mogelijkheden die de BI omgeving biedt.
Het spanningsveld tussen creatieve, snelle flexibele oplossingen en gecontroleerde beheersbare oplossingen, waar wetgeving en dus de organisatie ook om vraagt, zou volgens mij vooral een timing issue moeten zijn. Zorg voor een gecontroleerde, beheersbare data distributie omgeving met standaard rapportages en analyses. Biedt daar bovenop functionaliteit, flexibiliteit en ondersteuning aan de self-service BI-ers. Deze self-service BI-ers hebben dan vervolgens wel de plicht om wanneer daar herbruikbare en breder inzetbare informatieproducten ontstaan deze terug te voeren naar de gecontroleerde en beheersbare data distributie omgeving.
In veel gevallen zal IT verantwoordelijk zijn voor het beheer van deze data distributie omgeving. Van hen wordt dan verwacht dat ze deze gecontroleerd en beheersbaar houden. Daar is IT goed in. Wel moeten ze ook de kennis en kunde hebben om de herbruikbare en breder inzetbare informatieproducten die aan de business kant ontstaan weer te incorporeren in deze omgeving. De mate waarin ze daarin slagen bepaalt het succes.
Beste Ivo,
Leuk artikel en ook de term kluskabouter is aardig getypeerd. Vanuit de IT afdeling wel te verstaan :). Mijn eigen ervaring als ‘data scientist’ heeft mij geleerd dat een organisatie pas het verschil gaat maken als “de business” het belangrijkste beginsel doorheeft; dat zij zelf de producent en de eigenaar is van bedrijfsdata (de grondstof voor business informatie). Niet de IT afdeling; die zorgt als het goed is voor de ondersteunende machinerie (en als zij het niet doet, doet iemand anders het…).
Wat jammer dat de heer of mevrouw A. Nalist onder een bijnaam reageert want hij/zij slaat volgens mij de spijker op de kop.
Ik kan ook niet inschatten of het een IT-er is die advokaat van de duivel speelt, de “data-scientist”, laten we zeggen analist, brengt andere dingen mee dan alleen programmeren, it services of andere ICT vaardigheden. Het is volgens mij voor IT-ers alleen zorg de infrastructurele zaakjes op orde te maken, zonodig de data ter beschikking te stellen en aan de kant te gaan staan.