Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
    • Inzending indienen
    • Inzendingen
    • De jury en experts
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
    • Magazine
    • Adverteren in het magazine
  • Nieuwsbrief

Zijn schone gegevens belangrijk?

09 december 2004 - 23:003 minuten leestijdOpinieData & AI
Rick van der Lans
Rick van der Lans

In een van mijn vorige columns beschreef ik de mogelijke relatie tussen een service oriented architecture (soa) en een data warehouse. Veel services die wij uiteindelijk ontwikkelen, hebben een opvraagkarakter. De service moet de gevraagde gegevens dan ergens vandaan halen. De eerste gedachte is om die uit een bronsysteem te halen, maar waarom niet uit een data warehouse? Deze bevat immers opgeschoonde gegevens. Een ideale bron dus.

Een van de lezers was het daarmee oneens en schreef een nuttige reactie. Hij ging in op de vraag waar gegevens eigenlijk opgeschoond dienen te worden. Moeten we de bronsystemen zelf reinigen, moeten we ze pas reinigen als ze de operational data store (ODS) binnenkomen, of pas als ze het data warehouse instromen?
Het mooiste zou zijn als het reinigen bij de bronsystemen gebeurt. Hiervoor moeten twee exercities uitgevoerd worden. De gegevens moeten in de brondatabases gereinigd worden en de applicaties waarmee de gegevens ingevoerd worden, moeten onder handen genomen worden. Het moet moeilijker gemaakt worden voor gebruikers om incorrecte gegevens in te tikken (uiteraard zonder dat dit de gebruiksvriendelijkheid van de applicatie aantast). Doen we dit niet, dan blijft het opschonen dweilen met de kraan open.
Het aanpassen van bronsystemen is misschien wel de ideale oplossing, maar niet altijd mogelijk of gewenst. Niet elke organisatie staat te trappelen om oude bronsystemen aan te passen, omdat van sommige systemen geen documentatie meer bestaat, of omdat het aanpassen tot instabiliteit kan leiden. Als een aanpassing van bronsystemen vereist is, dan werpt dit een nog hogere drempel op om een data warehouse te gaan bouwen.
Vandaar dat veel organisaties ervoor kiezen om gegevens tijdens de kopieerslag van de bron naar de ODS of naar de data warehouse op te schonen. Het is daarmee ook een bewuste keuze om met twee inconsistente gegevensbronnen te werken: de niet-opgeschoonde bronsystemen en de wel opgeschoonde data warehouse.
Enkele organisaties besluiten om gegevens geheel niet op te schonen. De data warehouse geeft een beeld van de gegevens zoals ze in de bronsystemen opgeslagen zijn. Wel wordt er dan in de rapportage creatief met de cijfers gewerkt. Ze worden zodanig gemasseerd dat de rapporten er correct uitzien. In feite voert het rapportageproduct dan wat opschoningslagen uit. Niet ideaal, maar soms wel praktisch.
Waar en hoe een organisatie de defecte gegevens moet verbeteren, is afhankelijk van de wensen en eisen. Er is dus geen algemeen antwoord op deze vraag te geven. Het ligt aan de situatie.
Voor echte informatiefabrieken, zoals pensioen-, verzekeringsmaatschappijen en banken, zijn gegevens onmisbaar. Wat is bijvoorbeeld een pensioenmaatschappij nog waard wanneer we al hun gegevens zouden verwijderen? Uiteraard zijn hun kantoren ook wat waard, maar als we die weghalen, kan zo’n organisatie nog redelijk goed doorwerken. Gegevens zijn waarschijnlijk hun meest belangrijke bezit. Net zoals de voetballers van een professioneel voetbalteam van essentieel belang zijn, en het vrachtwagenpark dat voor een transportbedrijf is.
Bij elke informatiefabriek behoort gegevenskwaliteit hoog op de agenda te staan. Het opschonen van bronsystemen zal hier uitermate belangrijk zijn. Wat me soms wel verbaasd is dat voor sommige organisaties gegevens wel belangrijk zijn, maar dat ze die niet op de balans plaatsen. De vraag is dan hoe een dergelijke organisatie omgaat met gegevenskwaliteit.< BR>
 
Rick F. van der Lans is onafhankelijk adviseur, een internationaal bekend spreker en auteur van diverse boeken, tevens gespecialiseerd in softwareontwikkeling, datawarehousing en internet.

Meer over

ECMSOA

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Geïntegreerde ICT in de zorg

    Hoe samenhang in IT bijdraagt aan continuïteit en veiligheid

    Computable.nl

    Agentic AI in de praktijk

    Hoe autonome AI werkprocessen fundamenteel verandert

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Awards-inzendingen

    Pijl naar rechts icoon

    Check Point

    Nadia van Beelen (Sales Associate, Check Point Technologies)
    Pijl naar rechts icoon

    Cegeka

    Ammar Alkhatib (Cyber Security Advisor, Cegeka)
    Pijl naar rechts icoon

    ForceFusion

    Amber Quist (Cyber security specialist, ForceFusion)
    Pijl naar rechts icoon

    Howden Nederland

    Pieter-Jan Lommerse (cio, Howden Nederland)
    Pijl naar rechts icoon

    Rabobank

    Corence Klop (ciso, Rabobank)
    Alle inzendingen
    Pijl naar rechts icoon

    Populaire berichten

    Meer artikelen

    Meer lezen

    nummer zes
    Data & AI

    Dit zijn de gevaren van ai (6) voor mens en maat­schap­pij

    Data & AI

    Geen ai zonder keurmerk: waarom voor­uit­lo­pen op ISO 42001 slim is

    Carrière

    Nieuwe Box 3-stelsel jaagt techtalent het land uit

    cover boek De Grote Verandering
    Data & AI

    Van Empel ontrafelt impact van ai – en zet lezer aan het werk

    Cloud & Infrastructuur

    Kort: Datacenter NorthC heeft tijdelijke stroom­voor­zie­ning, SiSo verkocht aan EyeTi (en meer)

    Data & AI

    Ai neemt ons leven niet over (maar verandert het wel ingrijpend)

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2026 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs