Metadata en Wikipedia

Recentelijk was ik de voorzitter van een conferentie over metadata in Londen. Bij de opening had ik vijf minuten om over metadata te praten. Dagen ervoor liep ik al te ijsberen. Hoe zou ik die vijf minuten zinnig kunnen gebruiken? Ineens had ik een helder moment. Ik dacht, laat ik eens kijken wat Wikipedia, de internet-encyclopedie, over dit onderwerp te zeggen heeft.
Ik log in en zoek op het woord ‘metadata'. Tot mijn verbazing blijkt Wikipedia pagina's vol aan informatie over metadata te bevatten. Een term dus met een hoog WQ (Wikipedia Quotiënt). Ik was positief verrast, totdat ik ging lezen wat er stond.
Het begon allemaal onschuldig. Het woord meta betekent na in het Latijn, en in het Grieks staat het woord data voor informatie. De definitie die gegeven werd, was een klassieke: metadata is data over data. So far so good. Hierna werd het wat inhoudelijker en technischer. En toen begonnen mijn tenen ietwat te krommen.
Laat ik enkele voorbeelden geven. Er wordt onderscheid gemaakt tussen verschillende soorten metadata. Dat klinkt redelijk. Er is database-metadata, programma-metadata, en ook datawarehouse-metadata. De laatstgenoemde groep kan onderverdeeld worden in back room en front room metadata. Dat waren echter termen die ik nog niet kende. Op de conferentie liepen tientallen metadata-experts rond, maar na navraag bleek niemand van deze termen gehoord te hebben. Wie bedenkt dan die termen? Een soort metadata dat ook genoemd werd, was de 'vreemde' metadata.
Ook de nadelen van metadata werden beschreven. Een nadeel was dat metadata te complex is. De reden die gegeven werd was: eindgebruikers creëren geen metadata omdat bestaande formaten, en in het bijzonder MPEG-7, te ingewikkeld zijn. Pardon? Een ander nadeel was dat het erg veel zou worden, en het laatstgenoemde nadeel was dat metadata gewoonweg nutteloos is.
Wikipedia wordt ook wel een zelfcorrigerend systeem genoemd. Als er iets niet klopt, is er altijd wel iemand die het corrigeert. Als dat zo is, dan heeft dat mechanisme net even niet gewerkt voor de term metadata. Bij de beschrijving van Julius Ceasar ging het duidelijk helemaal fout, want daar stond: ‘Because of recent vandalism or other disruption, editing of this article by unregistered or newly registered users is currently disabled.'
Dit is wel het gevaar van Wikipedia en internet in het algemeen. Wie controleert die gegevens? Iedereen is in staat om de grootste onzin ongecontroleerd publiekelijk te maken. Nu denk ik wel dat ik op zo'n pagina over metadata kan bepalen wat correct is en wat niet. Maar hoe doe ik dat als het een onderwerp betreft waarover ik geen kennis heb?
Normaal maken we onderscheid tussen data en informatie. Sommigen voegen daar nog eens kennis aan toe. Data kunnen we vervolgens omtoveren tot informatie. Misschien moeten we, nu dat we internet en Wikipedia hebben, een andere categorie aan dit rijtje toevoegen: rommel. Uit de rommel moeten we eerst de data destilleren en die kunnen we vervolgens naar informatie omzetten.
Ik heb niets tegen Wikipedia of het internet, integendeel, maar we moeten ons wel realiseren dat informatie die niet gecontroleerd is, niet altijd betrouwbaar is.
Rick van der Lans
PS: Zou iemand met kennis van zaken willen inloggen op Wikipedia en die pagina's over metadata willen corrigeren?
Dat informatie niet altijd betrouwbaar is natuurlijk niet nieuw en geld niet alleen voor de wikipedia. Dat er regelmatig artikelen verschijnen over foute informatie op de wikioedia bewijst alleen dat het systeem werkt. Van foute info in andere encyclopedien lees ik nooit iets (en die hebben ongeveer evenveel fouten per artikel is gebleken bij onderzoek).
10-02 Van Vliet: Zonder internet geen welvaart
06-02 De kijk van Van Eijk: Sleutels weg
01-02 Spoelstra spreekt: Het is helemaal geen crisis
27-01 Van Vliet: Geen e-bank, geen bonus!
23-01 De kijk van Van Eijk: Technologie is een risico
18-01 Spoelstra spreekt: Flut hackers
15-01 Van Vliet: Uit het web
02-01 De kijk van Van Eijk: Onvermijdelijke vooruitgang
28-12 Spoelstra spreekt: Het verschil
23-12 Van Vliet: Politie.nl kent geen cybercrime
10-02 Infor helpt Ferrari met bouwen F1-auto's
10-02 Tester Four Oaks in Israëlische handen
10-02 Ex-Misys-topman moet CSC uit penarie helpen
09-02 Gebouwautomatiseerders kiezen branchebestuur
08-02 Sogeti ontslaat nog eens 110 medewerkers
08-02 Reseller verliest slag om het groene huishouden
07-02 Verhuurder Capgemini-pand vecht verhuizing aan
07-02 Nomineer nu voor de Computable Awards 2012
07-02 Europese ICT-beslissers voorzichtig met budget
06-02 'Marktwaardering Facebook is kwart te hoog'
|
|
Probleemloos ontwikkelen voor een hybride cloudmodel
Aanbieders van geavanceerde bedrijfsapplicaties willen nieuwe klanten graag de mogelijkheid geven om op......



wat mij nou juist verbaast uit het stuk dat je schrijft is dat je weet dat hetgeen geschreven staat niet correct is, maar dat je het zelf nalaat om dat op de wiki pagina aan te geven.
De oproep aan iemand - met kennis van zaken - doen om iets op te lossen wat jezelf hebt geconstateerd, lijkt me dan ook niet noodzakelijk. Als jezelf niet meewerkt aan het wikipedia mechanisme - wat je noemt in je stukje - zal het natuurlijk nooit gaan werken.