Data als waarheidsbron is een mythe

Gartner-fellow Frank Buytendijk mengt zich in big data-discussie

Wat is echt? Wat is waar? En maakt dat uit in de datagedreven wereld? Dit zijn allemaal vragen die Gartner-fellow Frank Buytendijk bezighouden. ‘De data-gedreven business is haast een religie geworden, met haar eigen dogma’s, en het wordt nauwelijks ter discussie gesteld.’ In het tijdperk van ‘big data als oplossing voor alles’ doet deze stelling de wenkbrauwen fronsen. De hoogste tijd voor een nadere kennismaking.

Frank Buytendijk gaat naar eigen zeggen met een ‘gestrekt been à la Nigel de Jong’ in de big data-discussie. ‘Ik vind dat data verworden zijn tot een religie waar velen in geloven zonder zich daarbij vragen te stellen, waardoor er sprake is van een dogma. Een ander woord voor dogma is ‘best practice’: doe vooral wat ik zeg, maar stel er geen vragen over. Ik probeer te provoceren, ik doe dit ook in mijn presentaties, waaronder die op Storage Expo 2016, want natuurlijk is data belangrijk. Data is echter niet in staat om de waarheid te vangen.’

Op scherp zetten

De Gartner-fellow realiseert zich dat er een belangrijke plaats is voor data in de digitale maatschappij. ‘Maar in plaats van eenzijdig dit geloof te beschrijven, ga ik eenzijdig de andere kant op. Ik ga in mijn presentaties in op de moeizame relatie tussen data en realiteit. Als je cynisch bent is dit overigens geen moeilijke relatie, want er is geen relatie. Om het op scherp te zetten: het gebruik van data als belangrijkste lens voor de waarheid is het domste wat je kunt doen, omdat het leidt tot de verkeerde beslissingen en slechte bedrijfsresultaten.’

Buytendijk zet in zijn presentaties mensen aan het denken. ‘Ik verwacht hierbij twee reacties. Of mensen gaan mee in mijn logica en redenatie en denken (‘zo heb ik er nog nooit tegen aan gekeken, misschien moeten we anders met data omgaan’), maar het kan ook zijn dat ze het niet met mee eens zijn. Dan kunnen ze met hernieuwd enthousiasme vasthouden aan data en met toewijding nog meer datagedreven beslissingen nemen.’ Uiteindelijk heeft Buytendijk twee boodschappen: de waarheid definiëren als een voldoende gedeelde observatie die gemeenschappelijk gedeeld wordt en dat de werkelijkheid met meer respect moet worden behandeld.

Objectiviteit is illusie

‘Een bedrijf mag zich nooit enkel baseren op data om de waarheid of realiteit te vangen’, meent Buytendijk. ‘Data mogen ook niet leidend zijn in de bedrijfsvoering, want dit leidt tot verkeerde beslissingen en slechte bedrijfsresultaten. Data zijn namelijk een armzalige afspiegeling van de werkelijkheid. We zien data ten onrechte als objectief. De waarheid die door data wordt geschetst is namelijk niet objectief.’ Het gaat volgens de onderzoeker al mis vanaf het moment dat data gemeten worden. ‘Data worden gemeten door een instrument. Dit kan hardware of software zijn. Dit instrument heeft een bepaald doel. Het meet alleen de dingen waarvoor het is gemaakt en filtert daarbij automatisch de aanwezige data. Data zijn dus per definitie subjectief in de letterlijke betekenis van het woord.’

Buytendijk beschrijft een filosofische depressie rondom het vinden van de waarheid. ‘We hebben eeuwen gekeken naar de waarheid volgens de ideeën van Plato: de waarheid is in zijn visie een onbereikbare (ideeën)wereld, waarvan alles wat wij als mens kunnen waarnemen slechts een afspiegeling is. Aan de andere kant is er de postmoderne visie van de waarheid, die stelt dat er slechts percepties van de waarheid zijn en dat alle percepties van deze waarheid naast elkaar kunnen bestaan en dat er dus niet één waarheid is. Hierdoor is elke uitspraak over de waarheid al bij voorbaat gedoemd te mislukken.’

Waarheid blijft zich ontwikkelen

De Amerikaanse pragmatisten, een nieuwere groep filosofen, bieden volgens de analist nog verlichting in deze depressie, door te stellen dat waarheid een voldoende gedeelde observatie is. ‘Het mooie hiervan is dat een gedeelde waarheid, nog geen universele waarheid is. De waarheid blijft zich dus ontwikkelen. Hierdoor is er een synthese gevonden tussen de Oude Grieken en de postmodernisten’, aldus de onderzoeker.

Een bedrijfsvoering gebaseerd op data doet de realiteit volgens de onderzoeker tekort. ‘De realiteit moet meer respect krijgen. We moeten niet proberen de werkelijkheid onze wil op te leggen, met ons ontwerp van processen. Als je het proces leidend maakt, creëer je namelijk enkel een administratieve werkelijkheid die losstaat van de dagelijkse realiteit. De oplossing hiervoor is om data meer inductief in plaats van deductief in te zetten’, aldus Buytendijk.

Een voorbeeld van een inductieve aanpak is volgens Buytendijk het zogenaamde zaakgericht werken. ‘Een zaak is een set van interacties om samen tot een bepaald doel te komen. Op deze manier kan het systeem de natuurlijke conversatie volgen. Dat is het tegenovergestelde van hoe processen in een erp-systeem vaak werken, waarbij processen een vaste volgordelijkheid hebben.’

Gegevens moeten volgens de analist centraal staan en niet het proces. ‘Als ik nu bijvoorbeeld naar een verzekeraar bel met een vraag over mijn zorgverzekering, kan ik niet gelijk ook informeren naar de status van mijn schademelding. Ik word eerst doorverbonden naar de bestreffende afdeling met vaak veel onduidelijkheid en rompslomp tot gevolg. Als ik als ‘zaak’ centraal zou staan in de processen, zou de gehele conversatie een stuk natuurlijker en dus efficiënter verlopen’, stelt Buytendijk.

Probleemsituaties

De Gartner-analist stelt dat er vier soorten probleemsituaties zijn, die elk om een andere oplossingsstrategie vragen. Hij gebruikt hiervoor het Cynefin-raamwerk. ‘Er zijn simpele, gecompliceerde, complexe en chaotische probleemsituaties. Bij simpele probleemsituaties observeer je wat er gebeurt en kan je aan de hand daarvan een juiste respons geven. Een voorbeeld hiervan is dat je bijvoorbeeld voor vijftien euro iets bestelt bij Bol.com en vanaf twintig euro je bestelling krijgt zonder verzendkosten. Daar heb je geen data en analyses voor nodig, de observatie voldoet om tot een optimale beslissing te komen. Een gecompliceerde probleemsituatie draait om een dusdanig ingewikkeld probleem dat het te lastig is voor mensen om op te lossen, waarbij de computer het wel kan. Dit is de wereld van data en analyse. Een voorbeeld is het inzichtelijk maken van het beste moment om een vlucht te boeken.’

Bij complexe en chaotische problemen schiet data(analyse) volgens Buytendijk echter te kort. ‘Een complex probleem is een niet-afgebakend probleem. Dus zodra je wat gaat meten, beïnvloed je al de werkelijkheid. Bij alles wat je doet, ben je onderdeel van je omgeving.’ Hoe los je dan het beste complexe problemen op? ‘Je kunt niet analyseren. Je moet dingen proberen om te kijken wat werkt. Denk bijvoorbeeld aan a/b-testen.’

Bij een chaotisch probleem moet er volgens Buytendijk direct worden overgegaan tot handelen en is er geen tijd om een en ander te analyseren. ‘Je moet hierbij uitgaan van de eigen waarden of ethiek. Later ga je pas bedenken hoe het moet worden opgelost, wie schuldig is en wie moet betalen.’ Als voorbeeld noemt de analist de terugroepactie van de Ford Pinto in 1978, waarbij achteraf bleek dat het voeren van rechtszaken goedkoper was dan de auto’s terug te roepen. ‘In 1977 begon het gerucht de ronde te doen dat de brandstoftank van de Pinto grote gebreken zou vertonen. Deze zou door de bouw van de wagen makkelijk kunnen worden doorboord bij een aanrijding van achteren, waarbij gevaarlijke situaties, zoals grote kans op brand door lekkende brandstof, zouden kunnen ontstaan. Ford zou hebben afgewogen of de kosten van een terugroepactie niet duurder zouden zijn dan het voor lief nemen van een aantal rechtszaken. Het verhaal is apocrief, maar leert een belangrijke les. Je moet in zo’n geval je eigen waarden en ethiek laten spreken.’

Juiste oplossing

Het belangrijkste wat it-beslissers volgens Buytendijk kunnen leren uit deze manier van denken, is dat complexiteitsreductie vaak niet de juiste oplossing is. ‘Je abstraheert echter de werkelijkheid en dat is geen goed idee, dan ben je los van de werkelijkheid. Waarom doen we dan toch aan complexiteitsreductie? Omdat dat ons in het gebied van gecompliceerde omgevingen brengt, waar analyse wel werkt. En dat zien we nu eenmaal liever.’

Een gecontroleerde omgeving en een afgebakende problematiek zijn essentieel om zonder schadelijke gevolgen te kunnen leren. ‘Neem bijvoorbeeld Microsoft Tay, een chatrobot die gebruikmaakte van machine-learning en leerde van tweets’, vervolgt de Gartner-fellow. ‘De robot uitte binnen de kortste keren racistische en vrouwonvriendelijke taal en binnen 24 uur was Tay alweer offline.’

Toch is de onderzoeker te spreken over dit experiment van de Amerikaanse softwaregigant. ‘Ze hebben hun best gedaan om iets moois te maken en hebben het vervolgens in de praktijk getest. Hier kunnen ze van leren. Je kunt zulke nieuwe technologieën het beste testen in niet-kritieke gebieden en dan pas later in een gecontroleerde omgeving serieus inzetten. Het is een voorbeeld van inductie. Iets testen en aan de hand van waarnemingen en ervaringen een beslissing nemen.’

Een andere grote belemmering om data te gebruiken voor bedrijfsbeslissingen, is volgens Buytendijk het feit dat de toekomst geen data kent. ‘Het enige wat we over de toekomst kunnen aannemen is dat zij er anders uitziet dan vandaag. Met veel managementmodellen wordt nagedacht over correlaties aan de hand van data, maar deze correlaties kun je enkel trekken in het heden, niet in de toekomst. Dit omdat de data alleen betrekking heeft op de huidige situatie. Als je aanneemt dat de toekomst anders is dan het verleden, dan invalideer je dus je managementmodel.’

Daarom is het volgens Buytendijk beter om te kiezen voor scenarioplanning in plaats van data-analyse. ‘Hierbij train je jezelf op het zien van verandering en kun je verschillende toekomstsituaties schetsen en je eigen rol hierin definiëren. Als de realiteit dan anders blijkt te zijn, is het niet erg, omdat je gewend bent om in verschillende toekomsten te denken. Je traint jezelf op het zien van veranderingen. Belangrijk hierbij is om te beseffen dat het meten van data statisch is, terwijl de toekomst dynamisch is. Daarom is het beter om de toekomst te bezien vanuit verschillende scenario’s. De toekomst is namelijk complex en je bent er zelf onderdeel van’, aldus de onderzoeker.

Van waarheid naar vertrouwen

Hoe kan een ict-manager, met alle mitsen en maren die door de analist zijn geschetst, nu het beste omgaan met data? ‘Voor een deel word je als ict-manager gedwongen om veel meer met realtime, externe data om te gaan. Het oude paradigma bij interne datawarehouses is dat alle gegevens moeten worden verzameld en geïntegreerd. Deze gegevens zijn volledig, correct en tijdig. Bij externe systemen heb je geen controle over de bron. Ze zijn wel tijdig, maar je weet niet of ze volledig of correct zijn. Het is daarom belangrijk om de stap te maken van waarheid naar vertrouwen. Hiervoor is datacontext essentieel.’

Bij alle data is het belangrijk om je vragen te stellen over de bron; bijvoorbeeld wat de herkomst is, wat de agenda van de bron is, of de data gratis is en hoe de data verkregen is. Daarnaast is het volgens Buytendijk cruciaal om te kijken of andere bronnen de data bevestigen. Verder is het belangrijk om stil te staan bij wie de data gebruikt. ‘Hoe vaak zijn gegevens geliked? Hoe beoordelen anderen deze gegevens? Geen van deze drie pijlers gaat over de data zelf. Het is de context. Mijn advies: bouw je governance in toenemende mate op hoe je gegevens kunt vertrouwen en leer je collega’s weer echt te managen met data. Data zijn hierbij slechts één van de onderdelen voor een beslissing. Als we enkel datagedreven zouden zijn, zouden we immers geen ondernemers meer zijn.’

Kwalitatieve research

Buytendijk benadrukt dat hij niet tegen het gebruik van algoritmes bij beslissingen is, maar stelt dat dit enkel zin heeft bij simpele of gecompliceerde problemen. ‘Laat kwalitatieve research bij complexe en chaotische problemen altijd een rol spelen. Etnografisch onderzoek of het uitgebreid spreken met tien klanten, geeft meer inzicht dan een klantonderzoek onder tienduizend klanten.’

Behalve advies voor de it-manager, heeft Buytendijk ook een beeld van de it’er van de toekomst. ‘Deze professional moet ofwel een keiharde bèta zijn, die kennis heeft van machine learning, wiskunde, statistiek, econometrie en operation research om algoritmes te kunnen bouwen, of moet een antropoloog zijn die bedreven is in het bestuderen van vreemde culturen. Door de overgang van digital businesses naar een digitale maatschappij, waarbij technologie een directe invloed heeft op ons leven, hebben we namelijk te maken met een vreemde cultuur. Daarnaast hebben we ook in toenemende mate ethici nodig.’

De analist meent dat veel banen in de toekomst gaan verdwijnen, maar dat hoeft geen probleem te zijn. ‘Veel kan geautomatiseerd worden, bijvoorbeeld in de advocatuur of accountancy. Maar daar komt ander werk voor terug: het maken en bouwen van die algoritmes en het bedienen ervan.’

Dit artikel is ook gepubliceerd in Computable Magazine 9 van november 2016

Frank Buytendijk is al jaren actief als analist en spreker op podia over de hele wereld. Hij is pionier op het gebied van digitale ethiek en heeft 25 jaar ervaring op het gebied van data, analytics en strategie. Hij is auteur van vijf boeken, waaronder ‘Dealing with Dilemmas’ en ‘Socrates Reloaded’, en een van zijn case studies is opgenomen in de Harvard Business Review-database. Zijn stijl laat zich het best beschrijven als informeel en provocatief, maar gebaseerd op gedegen research.

x

Om te kunnen beoordelen moet u ingelogd zijn:

Dit artikel delen:

Lees verder


Reacties

Goed verhaal.
Bekendste voorbeeld vandaag de dag is de miskleun van de peilingen tijdens de Amerikaanse verkiezingen. Dus mijn belangrijkste les (en dus ook die voor organisaties): bedenk dat er nog heel veel data is die je niet hebt verzameld!

Aanvullend op dit interessante verhaal is ook dat als je de klanten gaat bevragen je ook aangeeft dat je geïnteresseerd bent in hun ervaringen i.p.v. op een (IMHO) achterbakse manier door klantgegevens heen gaat spitten. Laten we vooral ethiek, moraliteit en menselijkheid als uitgangspunt blijven nemen.

Een zeer actueel onderwerp! Het grootste pijnpunt ligt volgens mij in vooringenomen onderzoek en de pseudowetenschap. Zo is de uitstoot van een auto afhankelijk van de RPM die de motor maakt en niet de snelheid, maar zo onderzoek wordt natuurlijk gesponsord door één of andere milieu organisatie die met een betuttelende calvinistische conclusie wil aankomen.

Maar ook in de ICT, natuurlijk.. Een tijdje terug bij een klant kwam ik een ICT dashboard tegen waarop het aantal incidenten gerapporteerd werd. Er was ook een drempelwaarde en dan werd het mooi groen, geel of rood. Waar ik nieuwsgierig naar was, was naar hoe die drempelwaarde bepaald werd. Toen ik na vraag deed, kwam het antwoord "Ja, dat is gebaseerd op de organisatie grootte en op cijfers die we van Gartner krijgen." Lachwekkend gewoon..

Interessant verhaal, vooral over het voorspellende karakter van data en modellen. Voor het heden maar niet voor in de toekomst. Zelf ook ondervonden en gezien. Heb het praatje van Buytendijk bijgewoond op de Storage/Securitybeurs, vond het het leukste van de dag.

IT-er van de toekomst. Keiharde beta's die bestudeerd worden door antropologen. Want zegnouzelf, raar volkje, wie begrijpt hen nog. Oja, en ethici. Hebben we ook nodig. Complex chaotisch waanzinnig, ik word er simpel van. In welk kwadrant zou ik zitten in Rene's Civile matrix ? Nee, doe mij maar de IT-er van het verleden. Veel eenvoudiger. Die is werkloos.

Een hoop open deuren gevat in moeilijk taalgebruik.

Veel appels/peer vergelijkingen uitmondende in een wereldvreemde slotconclusie/visie. Weleens een real-life ethicus gezien? Ethiek is het periodiek meten van de hellingshoek van de glijdende schaal. Een ethicus binnen een zakelijke omgeving is als een geestelijke in een bordeel. Een meevaller van dit stuk is dat die zo vreselijk belangrijke soft-skills niet worden genoemd.

Nu je het zegt, kj, ik zal even aanvullen :-)

Softskills zijn een steeds belangrijke factor in de ict. De huidige automatiseerder redt het niet meer met alleen technisch inhoudelijk kennis. De business verwacht volwaardige gesprekspartners om zo kosteneffectief en snel waarde te kunnen creeeren. Als ict-er deze eigenschappen omarmt en ziet de toekomst er rooskleurig uit. Maak ons klaar voor een tijdperk van selfserviceportals en dashboards waarbij de business weer aan de knoppen zit. Op naar een veelbelovend nieuw automatiseringsjaar.

@Dino
Business Buzzwords generator: http://projects.wsj.com/buzzwords2014/#

Stuur dit artikel door

Uw naam ontbreekt
Uw e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
article 2016-11-25T09:52:00.000Z Suzanne Martens en Christel Dieleman


Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.