Kenniswerker heeft baat bij vormloze informatie

Veredeling gegevens uit tekstdocumenten voor onderneming heel profijtelijk

Sinds 450 jaar is in de grafische sector de drie-eenheid 'inhoud-vorm-structuur' even heilig als de boekdrukkunst zelf. Het scheiden van de informatie-elementen inhoud, structuur en vorm maakt het mogelijk de documentaire informatievoorziening fors te verbeteren. Met behulp van informatisering is deze cluster makkelijk te scheiden schrijft drs J.J. Huygen. Hij heeft bij het Kadaster het V3-model beproefd waarmee deze drie-eenheid effectiviteit is te ontkoppelen.

Voor bedrijven en organisaties die informatie voortbrengen biedt Internet ruime mogelijkheden. Om dit wereldomspannende net als verspreidingsmedium zijn juiste plaats te geven in het scala van bestaande 'voortbrengingsprocessen', verdient het aanbeveling een algemeen aanvaard model te hanteren. Overeenkomsten en verschillen met bestaande processen zijn dan gemakkelijker te overzien. Dat maakt ook de discussie over toepassingen op Internet en het beheer van de content wat overzichtelijker.
Het in dit artikel beschreven algemene conceptuele V3-model vormt de basis voor het verspreiden van publicaties via Internet. Hiermee vervult het V3-model zijn rol, namelijk innovaties juist kunnen plaatsen en inbedden, zonder dat een model doel op zich wordt. Daarnaast zal duidelijk worden dat intranet-technologie een onderdeel moet zijn van een gestructureerde aanpak voor de bedrijfsinterne, elektronische documentaire informatievoorziening.

Grondslag voor het V3-model

De ervaring dat verdergaande digitalisering van documentgebruik een zeer waardevolle uitbreiding is van het informatieverkeer binnen en buiten organisaties, vormt de grondslag voor het V3-model. Het is gebleken dat van alle informatie die een bedrijf voortbrengt slechts 20 procent geschikt is om in databases op te slaan (financiële, personele en productie-informatie), en dat de overblijvende 80 procent van de bedrijfsinformatie is vastgelegd in (tekstverwerkers)documenten. Dit geldt ook voor bedrijven en organisaties waar administratieve registratie in de vorm van gegevenselementen plaatsvindt, zoals banken, verzekeraars, en overheidsinstellingen als de Belastingdienst of het Kadaster. Immers zodra een gegevenselement informatieve waarde moet krijgen, komt het terecht in een tekstverwerkersdocument of -formulier.
Deze 80 procent 'bedrijfsinformatie-in-documenten' profiteert niet of nauwelijks van de typische voordelen die gebruikelijk zijn voor gegevenselementen in database-systemen. Met andere woorden, als die 80 procent 'bedrijfsinformatie-in-documenten' zelfs maar voor een klein deel wèl is onder te brengen in een database dan zal het profijt al snel zichtbaar zijn. Het gebruik van dit soort documenten efficiënt en effectief bevorderen vergt aandacht voor vier aspecten: het organiseren, het vinden, het beheren en het publiceren van bedrijfsinformatie-in-documenten.
Hiermee belanden we op het terrein van elektronische documentaire informatievoorziening waarbij de voordelen van een database-managementsysteem zijn te handhaven. Het V3-model biedt hiervoor goede aanknopingspunten. In deze context ligt de nadruk op het intranet als verspreidingsmedium. Een intranet is een transportmedium en verpakking voor het verspreiden van informatie-producten.

Het model in detail

Dit model voor informatiebewerking kent drie kernprocessen: verzamelen, veredelen en verspreiden (afgekort tot V3-model). Deze drie kernprocessen zijn gegroepeerd rond het centrale 'vat' voor informatie-opslag, -verstrekking en -beheer: de medium-neutrale database (MND).
V3 is een schaalbaar model. Het is van toepassing op meerdere bedrijfsniveaus, op het bedrijf als geheel, op een bedrijfsafdeling en op individuele personen. Aan de 'verzamel'-kant komen gegevens in vele vormen binnen: on-line (via Internet of het intranet), op CD-Rom, in papieren vorm en door middel van handmatige invoer. Van belang bij al deze bronnen is dat de informatie digitaal wordt aangeleverd om handwerk zoveel mogelijk te vermijden. De eigen interne productiedatabases van de primaire processen vormen ook een ideale toeleverancier van gegevens die zijn op te nemen in de MND voor 'documentaire informatievoorziening'. Door ze te behandelen als toeleveranciers (en dus niet te belasten met de informatievoorziening zelf) blijven de productiedatabases voor het primaire proces beschikbaar en daarop toegesneden. Dit is bijvoorbeeld van groot belang voor de primaire productiedatabases van het Kadaster waar per dag circa 20.000 vastgoed- en hypotheekakten worden geregistreerd. Deze gegevens aan de verzamelkant zijn te beschouwen als de ruwe grondstof voor de volgende stap: het 'veredelen'.

Kenniswerkers veredelen

Veredelen is veelal mensenwerk waarbij computers als gereedschap fungeren. Veredeling bestaat uit het bewerken van de verzamelde informatie. Deze bewerking kan simpel van aard zijn (het opnieuw rangschikken op een elektronisch formulier) of complexer (zoals het gebruiken van de informatie als basismateriaal voor bijvoorbeeld een adviesrapport). Voorop staat dat er waarde moet worden toegevoegd tijdens de veredeling om de bedrijfsdoelstellingen te realiseren. De term 'kenniswerker' is hier zeker op zijn plaats.
De veredeling dient geen invloed te ondergaan van het uiteindelijke medium waarop of waarin het eindproduct wordt verspreid. Met andere woorden, de halffabrikaten of eindproducten (inhoudelijk gezien) zijn neutraal waar het de uiteindelijke vorm en het medium betreft waarin ze worden verspreid. Met 'vorm' wordt bedoeld: vet, cursief, lettergrootte, kadertje hier, lijntje daar, enzovoort.
De gekozen verspreidingsvorm dient afgestemd te zijn op de doelgroep(en). Dit laatste kan betekenen dat het eindproduct via meerdere media wordt verspreid, zoals on-line (via Internet bijvoorbeeld), op CD-Rom of in papieren vorm. Het geschikt maken van de inhoud voor een of meerdere media is een (na)bewerking die wel geheel toegespitst mag worden. Hoogstwaarschijnlijk worden er dan specifieke hulpmiddelen gebruikt voor het verspreidingsmedium. Uiteraard wordt snelheid nagestreefd door de (na)bewerking geautomatiseerd te laten plaatsvinden. Zo is een dergelijke nabewerking van de inhoud naar pure intranet-pagina's goed mogelijk. Een bewerking van de inhoud die is toegespitst op verspreiding in een interactieve applicatie met bijvoorbeeld video en op CD-Rom, vereist een andersoortig na-traject.

De Medium Neutrale Database

De centrale database is bedoeld voor opslag van eindproducten. Eindproducten in inhoudelijke zin, dus zonder coderingen voor vormaspecten. Dit wil zeggen: dat teksten correct zijn wat betreft formulering, interpunctie enzovoort; dat illustraties en schema's de gewenste zeggingskracht bezitten en ze in het gewenste grafische formaat staan; dat eventueel audio en video de gewenste communicatiekracht bezitten; en dat er een logische structuur is aangebracht (voor rapporten bijvoorbeeld een inleiding, kern en slot). De wijze waarop deze logische document-structuur wordt aangebracht bestaat uit codering volgens de 'standard generalized mark-up language' (sgml) of de html-codering (hypertext mark-up language). Dit is een technische randvoorwaarde die niet alleen geldt voor intranet-publicaties, maar vooral ook voor verbeteringen in de interne elektronische documentaire informatievoorziening.
Doordat de eindproducten in de MND worden opgeslagen kunnen raadplegers ze weer gebruiken als grondstof voor andere nieuwe informatie-producten (in essentie verandert zo'n eindproduct dan op slag in een halffabrikaat dat al geheel aan de interne formaten voldoet). Op deze wijze wordt hergebruik van informatie flink gestimuleerd, waarbij versiebeheer goed is uit te voeren. Echter, eindproducten in hun samengestelde vorm weer opslaan in de MND brengt redundantie met zich mee (de losse inhoud staat immers al in de MND, omdat er alleen een nieuwe combinatie mee is gemaakt). Voor het vermijden van redundantie op eindproduct-niveau is evenwel een oplossing voorhanden waarvan het te ver voert die hier toe te lichten. Nadat uit de MND de gewenste inhoud is geëxtraheerd, kan de 'content' een nabewerking ondergaan die is toegespitst op het gewenste verspreidingsmedium. Pas bij de nabewerking wordt ook de vorm toegekend die van toepassing is voor het verspreidingsmedium.

Documenteigen structuren

De volgende documenten horen in de MND thuis: de inhoud van te publiceren Internet- of intranet-pagina's, rapporten, beleidsnota's, handboeken, opleidingsmateriaal, gebruikersdocumentatie, interne brochures en nieuwsbrieven, projectdocumentatie, technische documentatie, bedrijfscorrespondentie en memo's en zelf-geschreven of -beheerde artikelen. Elk vastgelegd met zijn eigen documentstructuur (vergelijkbaar met style-sheets maar dan doorzoekbaar, ter plekke op maat te snijden, af te schermen, verplicht te stellen enzovoorts. En dit alles in de structuur van het document). Deze documentstructuur wordt vastgelegd met sgml; een open en gestandaardiseerde (ISO) syntaxis voor het beschrijven en coderen van de logische documentstructuur. Sgml zelf doet niets met de informatie; het zijn de applicaties eromheen die de sgml-codering gebruiken om de document-elementen te manipuleren en toegankelijk te maken. Vergelijk dit met de html-teksten in een browser: de tekst met html-code doet niets, het is de browser die de interactie mogelijk maakt.

Publiceren op Internet

Vanuit sgml is html afgeleid voor publicaties op Internet. Met andere woorden, html is een subset van sgml waardoor alle informatie uit de MND desgewenst naar het intranet is te converteren. Maar html benut bij lange na niet de kracht van de sgml-codering en daarom geniet sgml voor de documentaire informatievoorziening de voorkeur. Het feit dat html een subset is betekent tevens dat de informatie kan worden geraadpleegd op elk computerplatform dat voorzien is van een sgml/html-browser. Zodoende zit een organisatie niet meer vast aan bijvoorbeeld één soort tekstverwerker en het niet-uitwisselbare bestandsformaat. Tekstverwerkers zijn namelijk primair afgestemd op afdrukken wat tot gevolg heeft dat de vormaspecten voor dat ene verspreidingsmedium (papier) geheel met de inhoud van het document vervlochten zijn. Uiteraard laat sgml ook een goede afdruk op papier toe.
Daar komt bij dat tekstverwerkers eenvoudig hergebruik in de weg staan. Bovendien voldoen ze absoluut onvoldoende aan de vier grondbeginselen voor optimaal database-georiënteerd gebruik van 'bedrijfsinformatie-in-documenten' zoals geschetst aan het begin van dit artikel (de reeks organiseren, vinden, beheren en publiceren van 'bedrijfsinformatie-in-documenten').
Kortom, de MND fungeert als ontvangst-, verzend- en opslagruimte voor de documentaire informatievoorziening die er met zijn specifieke functionaliteit omheen wordt gebouwd. In principe is elk object-relationeel database-managementsysteem geschikt, onder andere die van Oracle en Informix, maar 'native' voorzieningen voor intranetten en sgml/html-converters maken zo'n database wel geschikter.

Ontkoppel inhoud, structuur en vorm

De termen inhoud, structuur en vorm zijn al gevallen. Het V3-model krijgt zijn effectiviteit en beheerbaarheid door deze drie-eenheid los te koppelen. Een drie-eenheid die de afgelopen 450 jaar in de grafische sector gangbaar was, maar die tegenwoordig met behulp van informatisering makkelijk is te scheiden. Dit scheiden van de drie informatie-elementen inhoud, structuur en vorm, maakt het mogelijk de informatievoorziening op documentair vlak fors te verbeteren. Deze optimalisatie is onder andere te bereiken door een aantal van de huidige problemen weg te nemen of tenminste minder zwaar te laten wegen.
Moeilijk versiebeheer is een van die problemen. 'Mijn handboek loopt altijd achter', luidt een veelgehoorde klacht. Als reden wordt opgegeven dat het omslachtig en kostbaar is om bij elk gewijzigd woord in een WP- of Word-bestand iedere betrokkene een nieuwe versie te verstrekken.
Omdat het ondoenlijk is om op elke kamer een exemplaar van een handleiding neer te zetten, is ook lage beschikbaarheid zo'n veelgehoorde klacht. "De handleiding staat op de derde verdieping en ik wil het op de negende inzien", heet het dan.
Dan doet zich het probleem van de veroudering voor: "De procedurele richtlijnen worden aangepast maar dat duurt nog wel even, terwijl ik nu een beslissing moet nemen", of "De technische documentatie is na een maand van oplevering al verouderd omdat het systeem wordt bijgewerkt." Als redenen worden hiervoor opgegeven dat dit komt door de 'print-dwang': alles pas te willen opleveren als het op papier staat; en het feit dat de IT-systemen blijkbaar makkelijker zijn te actualiseren (en distribueren) dan de documentatie.
Het alles of niets-probleem: "Ik heb wel toegang tot de bestanden maar ik heb slechts een selectie nodig uit een document." Hierbij geldt dat in een document niets is af te bakenen op individuele basis, laat staan dat slim zoeken op paragraaf- of elementtypen mogelijk zou zijn.
Verrassend veel ergernissen met papier en elektronische documenten in tekstverwerkersformaat hangen namelijk samen met de vervlochtenheid van inhoud, structuur en vorm. Door deze elementen te ontkoppelen en pas zo laat mogelijk in de informatie-productie-cyclus te vervlechten, neemt de effectiviteit toe, ontstaan verregaande mogelijkheden voor (her)gebruik en wordt de efficiëntie van beheer en onderhoud beter.
De ontkoppeling maakt het mogelijk voor elk van de drie aspecten de meest geëigende hulpmiddelen in te zetten. In het V3-model is de MND het vat voor de gestructureerde inhoud. De structuur van de inhoud, en daarmee de structuur en mogelijkheden van de documentaire informatievoorziening, wordt vastgelegd met de syntaxis van sgml. Op deze wijze is met de MND zogeheten content-management uit te voeren.

Workflowmanagement en groupware

Documentaire informatievoorziening die volgens het V3-model beschikbaar is gesteld via een intranet opent beter uitgebalanceerde mogelijkheden voor 'workflow' en 'groupware'. Dit geldt voor workflow omdat het workflow-managementsysteem zich niet hoeft te bekommeren om het organiseren, vinden, beheren en publiceren van de bedrijfsinformatie. Dit wordt door het documentaire V3-systeem afgehandeld. Hierdoor kan workflowmanagement (wfm) zich richten op het waarmaken van zijn naam: het beheren en sturen van de bedrijfsprocessen. De benodigde informatie voor een werktaak wordt simpelweg aangevraagd bij het V3-systeem. In de praktijk blijkt dat de betere commercieel beschikbare software-pakketten voor documentaire informatievoorziening een uitbreiding kennen met basale workflow-functies, en dat wfm-pakketten vaak een uitbreiding kennen met basale documentaire functies. De twee technologieën vormen een sterke combinatie.
Intranet speelt een belangrijke faciliterende rol bij groepswerk met groupware. De voordelen hiervan zijn algemeen bekend. De kracht van het V3-systeem komt vooral naar voren in de 'versioning', het organiseren (groepswerk geschiedt veelal gedistribueerd) en het publiceren van de bedrijfsinformatie (immers medium-onafhankelijk). Aangezien het werken met groupware als een specifieke variant van workflowmanagement beschouwd kan worden, is ook in dit geval een sterke combinatie met een documentair V3-systeem mogelijk.
 
Drs J.J. Huygen
Businessconsultant
Workflowmanagement & Electronic Publishing

Bedrijfsflexibiliteit
Het V3-model (verzamelen, verdelen en verspreiden) is modulair van opzet waardoor rond de medium-neutrale database (MND) verschillende informatie-productieprocessen kunnen worden geformeerd, bijgesteld, toegevoegd of vervangen. Met dit model is een beheerbaar, onderhoudbaar en vooral ook werkbaar Intranet-Productie-Proces samen te stellen. Door dit model - met de mogelijkheid tot informatie-ontkoppeling - neemt de bedrijfsflexibiliteit wat betreft documentaire informatievoorziening toe. En zeker voor informatie-intensieve bedrijven is dat een noodzaak.

x

Om te kunnen beoordelen moet u ingelogd zijn:

Dit artikel delen:

Nieuwsbrief

Wil je dagelijks op de hoogte gehouden worden van het laatste ict-nieuws, trends en ontwikkelingen? Abonneer je dan op onze gratis nieuwsbrief.

Vul een geldig e-mailadres in

Stuur dit artikel door

Uw naam ontbreekt
Uw e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
article 1997-10-31T00:00:00.000Z Koos Huygen
Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.