Recentelijk was ik de voorzitter van een conferentie over metadata in Londen. Bij de opening had ik vijf minuten om over metadata te praten. Dagen ervoor liep ik al te ijsberen. Hoe zou ik die vijf minuten zinnig kunnen gebruiken? Ineens had ik een helder moment. Ik dacht, laat ik eens kijken wat Wikipedia, de internet-encyclopedie, over dit onderwerp te zeggen heeft.
Ik log in en zoek op het woord ‘metadata'. Tot mijn verbazing blijkt Wikipedia pagina's vol aan informatie over metadata te bevatten. Een term dus met een hoog WQ (Wikipedia Quotiënt). Ik was positief verrast, totdat ik ging lezen wat er stond.
Het begon allemaal onschuldig. Het woord meta betekent na in het Latijn, en in het Grieks staat het woord data voor informatie. De definitie die gegeven werd, was een klassieke: metadata is data over data. So far so good. Hierna werd het wat inhoudelijker en technischer. En toen begonnen mijn tenen ietwat te krommen.
Laat ik enkele voorbeelden geven. Er wordt onderscheid gemaakt tussen verschillende soorten metadata. Dat klinkt redelijk. Er is database-metadata, programma-metadata, en ook datawarehouse-metadata. De laatstgenoemde groep kan onderverdeeld worden in back room en front room metadata. Dat waren echter termen die ik nog niet kende. Op de conferentie liepen tientallen metadata-experts rond, maar na navraag bleek niemand van deze termen gehoord te hebben. Wie bedenkt dan die termen? Een soort metadata dat ook genoemd werd, was de 'vreemde' metadata.
Ook de nadelen van metadata werden beschreven. Een nadeel was dat metadata te complex is. De reden die gegeven werd was: eindgebruikers creëren geen metadata omdat bestaande formaten, en in het bijzonder MPEG-7, te ingewikkeld zijn. Pardon? Een ander nadeel was dat het erg veel zou worden, en het laatstgenoemde nadeel was dat metadata gewoonweg nutteloos is.
Wikipedia wordt ook wel een zelfcorrigerend systeem genoemd. Als er iets niet klopt, is er altijd wel iemand die het corrigeert. Als dat zo is, dan heeft dat mechanisme net even niet gewerkt voor de term metadata. Bij de beschrijving van Julius Ceasar ging het duidelijk helemaal fout, want daar stond: ‘Because of recent vandalism or other disruption, editing of this article by unregistered or newly registered users is currently disabled.'
Dit is wel het gevaar van Wikipedia en internet in het algemeen. Wie controleert die gegevens? Iedereen is in staat om de grootste onzin ongecontroleerd publiekelijk te maken. Nu denk ik wel dat ik op zo'n pagina over metadata kan bepalen wat correct is en wat niet. Maar hoe doe ik dat als het een onderwerp betreft waarover ik geen kennis heb?
Normaal maken we onderscheid tussen data en informatie. Sommigen voegen daar nog eens kennis aan toe. Data kunnen we vervolgens omtoveren tot informatie. Misschien moeten we, nu dat we internet en Wikipedia hebben, een andere categorie aan dit rijtje toevoegen: rommel. Uit de rommel moeten we eerst de data destilleren en die kunnen we vervolgens naar informatie omzetten.
Ik heb niets tegen Wikipedia of het internet, integendeel, maar we moeten ons wel realiseren dat informatie die niet gecontroleerd is, niet altijd betrouwbaar is.
Rick van der Lans
PS: Zou iemand met kennis van zaken willen inloggen op Wikipedia en die pagina's over metadata willen corrigeren?
Beste Rick,
wat mij nou juist verbaast uit het stuk dat je schrijft is dat je weet dat hetgeen geschreven staat niet correct is, maar dat je het zelf nalaat om dat op de wiki pagina aan te geven.
De oproep aan iemand – met kennis van zaken – doen om iets op te lossen wat jezelf hebt geconstateerd, lijkt me dan ook niet noodzakelijk. Als jezelf niet meewerkt aan het wikipedia mechanisme – wat je noemt in je stukje – zal het natuurlijk nooit gaan werken.
Voor alle duidelijkheid het gaat hier over de Engelstalige versie van de encyclopedie. Voor veelvuldige gebruikers van de site is het duidelijk dat er nog wel wat werk is aan dit artikel. Er staat een melding op dat het dient opgekuist en in de geschiedenis staat dat het een start-pagina is, dus een waar nog wel wat werk aan is.
Dat informatie niet altijd betrouwbaar is natuurlijk niet nieuw en geld niet alleen voor de wikipedia. Dat er regelmatig artikelen verschijnen over foute informatie op de wikioedia bewijst alleen dat het systeem werkt. Van foute info in andere encyclopedien lees ik nooit iets (en die hebben ongeveer evenveel fouten per artikel is gebleken bij onderzoek).