Flexibel informatiebeheer met XML

Structuur brengen in ongestructureerde gegevens

Dit artikel delen:

De ervaring leert dat de scheidslijn tussen ongestructureerde informatie en gestructureerde informatie tijdens de implementatie van ECM (Enterprise Content Management) nog wel eens wil vervagen. Dit heeft vaak te maken met de toetrede van XML in dergelijke trajecten.

Enterprise Content Management of ECM biedt oplossingen voor het organisatiebreed organiseren van alle (ongestructureerde) informatiestromen. Er zijn verschillende systemen op de markt beschikbaar die het creëren, beheren en distribueren van dit soort informatie op basis van workflow-processen goed kunnen ondersteunen. De vraag die zich al vaak snel voordoet in ECM trajecten is wat nou precies ongestructureerde informatie is. Zijn dat losse documenten? Zijn dat tekeningen? Zijn dat tabellen in documenten? Is een website ongestructureerde informatie? XML biedt de mogelijkheid om structuur aan te brengen in anders ongestructureerde informatie, zonder dat daar databases voor nodig zijn.

Toepasbaarheid van XML

Op hoofdlijnen kent XML twee toepassingsgebieden. Van oudsher is XML een opslagformaat, bedoeld voor het opslaan van teksten waarvan kennis van de structuur nuttige aanvullende voordelen oplevert. Neem een encyclopedie; bij het zoeken op een trefwoord is het nuttig te weten waar de trefwoorden staan, en waar de uitleg en de eventuele verwijzingen. Alleen het trefwoordveld wil je doorzoeken. Ook voor technische documentatie biedt XML veel voordelen, zeker bij one-of productielijnen (waarbij steeds complexe unieke producten worden samengesteld op basis van steeds vergelijkbare componenten). Daar wil men graag gebruik maken van de mogelijkheid die XML biedt om delen van teksten (handleidingen) voor andere teksten (afgeleide handleidingen) te hergebruiken. Beide voorbeelden verklaren de vroege adoptie van SGML (de voorloper van XML) in de defensie, luchtvaart en uitgeefindustrie.
De laatste jaren heeft vooral de toepassing van XML als integratiemedium veel aandacht gekregen. Webservices gebruiken XML als bestandsformaat voor het verzenden en ontvangen van berichten tussen applicaties waardoor de integratie tot stand komt.
Door deze brede mogelijkheden van XML wordt deze standaard wijdverbreid toegepast. Daar is op zich niks mis mee; de standaard is van niemand en dus van iedereen, de specificaties van de standaard zijn gratis te downloaden en bovendien proberen de instanties die zich bezighouden met de totstandkoming van XML en gerelateerde standaarden (W3C) de eenvoud en praktische toepasbaarheid van de standaard te garanderen. Wél een nadeel is dat het voor niet-experts steeds lastiger wordt om te doorgronden wat de verschillende leveranciers van standaardapplicaties bedoelen met 'XML-compliant'of 'ondersteunt XML'.

Verschillende vormen

Een pakket kan op veel verschillende manieren XML ondersteunen. De vraag is welke vorm van XML ondersteuning nodig is, en hoe te achterhalen is welke vorm van XML ondersteuning een applicatie biedt.
Hoewel men zou verwachten dat ondersteuning van XML aan de binnenkant van een applicatie begint, is juist de XML ondersteuning aan de buitenkant van de applicatie het meest eenvoudig te realiseren. Het laten interfacen van een applicatie op basis van XML (webservices) betekent namelijk niet dat de applicatie zelf XML gebruikt voor interne datatransfer of contentopslag. Dergelijke applicaties kunnen intern nog steeds gebruik maken van allerlei eigen en dus niet-standaard (proprietary) technologieën.
Ook binnen het vakgebied van Enterprise Content Management is XML als technologie al geruime tijd toegetreden. Veel leveranciers van Enterprise Content Management software hebben de standaard al in een vroeg stadium geadopteerd. In Nederland was Tridion één van de partijen die al vroeg serieus met XML aan de slag ging. De reden hiervoor was dat XML meer flexibiliteit biedt, in ieder geval met het oog op mogelijk hergebruik van de informatie opgeslagen in het content management systeem.

Grote verschillen

Internationaal verschilt de wijze waarop leveranciers XML toepassen in hun ECM oplossingen sterk. Deze verschillen zijn van invloed op de markten waarop deze leveranciers succesvol (kunnen) zijn. Leveranciers die van oorsprong uit de Document Management markt komen en geen XML specifieke aanpassingen aan hun oplossingen hebben gedaan, hebben soms moeite overeind te blijven in markt waar de complexiteit van content en de mate van hergebruik hoger zijn. De complexiteit van de content wordt dan vooral bepaald door de structuur van de content.
Een goed voorbeeld van een marktgebied waar hoge eisen worden gesteld aan de herbruikbaarheid van (stukjes van) hoogcomplexe content is die van de technische documentatie. Organisaties als Boeing, Harley Davidson en John Deere maken technologisch complexe (en vaak unieke) producten. Voor het opstellen van gebruiks- en onderhoudshandleidingen willen deze partijen kunnen putten uit eerdere documentatie. Deze documentatie moet - vanwege de enorme hoeveelheid - eenvoudig geschikt gemaakt worden voor vergelijkbare producten. In deze markt zien we een klein aantal hooggespecialiseerde leveranciers die XML tot een "way of life" hebben verklaard. Het Nederlandse X-Hive is een goed voorbeeld hiervan. Hun content management product Docato is speciaal gericht op het beheren van technische documentatie en volledig gebaseerd op XML en gerelateerde standaarden. Directeur Jeroen van Rotterdam is actief binnen het W3C, het consortium verantwoordelijk voor de ontwikkeling van de XML en alle gerelateerde standaarden.
Hiermee is meteen de breedte van het speelveld aangegeven van de rol van XML binnen Enterprise Content Management. Van nauwelijks aanwezig (behalve voor het integreren met andere applicaties) in het geval van Document Management tot volledig XML gebaseerd in het geval van specialistische oplossingen voor TechDoc.

Paraplubegrip

Voor een organisatie is de belangrijkste vraag welke vorm van content management nodig is. Enterprise Content Management is vooralsnog een paraplubegrip, zeker zolang de leveranciers hun deeloplossingen niet beter geïntegreerd hebben tot één totaaloplossing. De verschillende vormen van content management die vallen binnen ECM zijn onder meer web content management en document management. Maar ook XML content management voor publicatieprocessen, collaboration voor virtuele samenwerkingsomgevingen (content delen) en portaaloplossingen vallen onder de ECM vlag.
Er zijn nog maar weinig organisaties bezig met ECM in de brede zin die de term doet suggereren. Wél zijn er allerlei organisaties die op ECM-deelgebieden vooruitstrevende projecten hebben gedaan. Hier komt de in deze trajecten verschillende rol van XML duidelijk naar voren.
Voor de klant van de ECM leveranciers zou XML iets moeten zijn wat ergens diep verborgen in uw eindoplossing aanwezig zou kunnen zijn. Als u van plan bent bestaande documentgestuurde informatieprocessen binnen uw organisatie te ondersteunen, maak u dan vooral niet druk om XML. En als u dat wel doet (bijvoorbeeld omdat u bepaalde printgeoriënteerde publicatieprocessen wilt ondersteunen), zorg dan voor voldoende kennis van XML om de antwoorden van leveranciers te kunnen doorgronden. Het toepassen of ondersteunen van XML is namelijk één ding, maar het toepassen van XML op een manier die daadwerkelijk meerwaarde biedt, blijkt vooralsnog nog steeds iets heel anders.< BR>
 
Paul Baan, Capgemini

x

Om te kunnen beoordelen moet u ingelogd zijn:

Dit artikel delen:

Stuur dit artikel door

Uw naam ontbreekt
Uw e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
article 2005-02-25T00:00:00.000Z Paul Baan
Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.