Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Overzicht
    • Nieuws
    • Winnaars
    • Partner worden
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
  • Nieuwsbrief

Zijn schone gegevens belangrijk?

09 december 2004 - 23:003 minuten leestijdOpinieData & AI
Rick van der Lans
Rick van der Lans

In een van mijn vorige columns beschreef ik de mogelijke relatie tussen een service oriented architecture (soa) en een data warehouse. Veel services die wij uiteindelijk ontwikkelen, hebben een opvraagkarakter. De service moet de gevraagde gegevens dan ergens vandaan halen. De eerste gedachte is om die uit een bronsysteem te halen, maar waarom niet uit een data warehouse? Deze bevat immers opgeschoonde gegevens. Een ideale bron dus.

Een van de lezers was het daarmee oneens en schreef een nuttige reactie. Hij ging in op de vraag waar gegevens eigenlijk opgeschoond dienen te worden. Moeten we de bronsystemen zelf reinigen, moeten we ze pas reinigen als ze de operational data store (ODS) binnenkomen, of pas als ze het data warehouse instromen?
Het mooiste zou zijn als het reinigen bij de bronsystemen gebeurt. Hiervoor moeten twee exercities uitgevoerd worden. De gegevens moeten in de brondatabases gereinigd worden en de applicaties waarmee de gegevens ingevoerd worden, moeten onder handen genomen worden. Het moet moeilijker gemaakt worden voor gebruikers om incorrecte gegevens in te tikken (uiteraard zonder dat dit de gebruiksvriendelijkheid van de applicatie aantast). Doen we dit niet, dan blijft het opschonen dweilen met de kraan open.
Het aanpassen van bronsystemen is misschien wel de ideale oplossing, maar niet altijd mogelijk of gewenst. Niet elke organisatie staat te trappelen om oude bronsystemen aan te passen, omdat van sommige systemen geen documentatie meer bestaat, of omdat het aanpassen tot instabiliteit kan leiden. Als een aanpassing van bronsystemen vereist is, dan werpt dit een nog hogere drempel op om een data warehouse te gaan bouwen.
Vandaar dat veel organisaties ervoor kiezen om gegevens tijdens de kopieerslag van de bron naar de ODS of naar de data warehouse op te schonen. Het is daarmee ook een bewuste keuze om met twee inconsistente gegevensbronnen te werken: de niet-opgeschoonde bronsystemen en de wel opgeschoonde data warehouse.
Enkele organisaties besluiten om gegevens geheel niet op te schonen. De data warehouse geeft een beeld van de gegevens zoals ze in de bronsystemen opgeslagen zijn. Wel wordt er dan in de rapportage creatief met de cijfers gewerkt. Ze worden zodanig gemasseerd dat de rapporten er correct uitzien. In feite voert het rapportageproduct dan wat opschoningslagen uit. Niet ideaal, maar soms wel praktisch.
Waar en hoe een organisatie de defecte gegevens moet verbeteren, is afhankelijk van de wensen en eisen. Er is dus geen algemeen antwoord op deze vraag te geven. Het ligt aan de situatie.
Voor echte informatiefabrieken, zoals pensioen-, verzekeringsmaatschappijen en banken, zijn gegevens onmisbaar. Wat is bijvoorbeeld een pensioenmaatschappij nog waard wanneer we al hun gegevens zouden verwijderen? Uiteraard zijn hun kantoren ook wat waard, maar als we die weghalen, kan zo’n organisatie nog redelijk goed doorwerken. Gegevens zijn waarschijnlijk hun meest belangrijke bezit. Net zoals de voetballers van een professioneel voetbalteam van essentieel belang zijn, en het vrachtwagenpark dat voor een transportbedrijf is.
Bij elke informatiefabriek behoort gegevenskwaliteit hoog op de agenda te staan. Het opschonen van bronsystemen zal hier uitermate belangrijk zijn. Wat me soms wel verbaasd is dat voor sommige organisaties gegevens wel belangrijk zijn, maar dat ze die niet op de balans plaatsen. De vraag is dan hoe een dergelijke organisatie omgaat met gegevenskwaliteit.< BR>
 
Rick F. van der Lans is onafhankelijk adviseur, een internationaal bekend spreker en auteur van diverse boeken, tevens gespecialiseerd in softwareontwikkeling, datawarehousing en internet.

Meer over

ECMSOA

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Trek AI uit de experimenteerfase

    Een gids over AI als strategisch instrument en op welke manier je écht waarde toevoegt aan je organisatie.

    Computable.nl

    Servers onder de loep – Een nieuw tijdperk

    Nieuwe eisen aan prestaties en beveiliging. De toekomst van serverbeheer.

    Computable.nl

    Slim verbonden en veilig georganiseerd

    Waarom connectiviteit en security onlosmakelijk verbonden zijn.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Populaire berichten

    Meer artikelen

    Uitgelicht

    Partnerartikel
    Data & AI

    Open Webconcept levert AI-oplossing vo...

    Hoe bescherm je persoonsgegevens in documenten die je als overheid wil delen of hergebruiken? Het project ‘Anonimiseren met LLM’ –...

    Meer persberichten

    Meer lezen

    cloudsoevereiniteit EU
    Data & AI

    Kort: Nieuwe EU-eisen voor cloudsoevereiniteit, in 2026 zes biljoen voor ict (en meer)

    OpenAI atlas
    Data & AI

    Hello Atlas, bye bye Chrome?

    Cloud & Infrastructuur

    Checklist overstappen naar Europese cloudomgeving

    Data & AI

    Spoelstra Spreekt: Gokje

    datacenter
    Data & AI

    Kort: Voor quantumwetenschap is Nederland top, overnamegolf datacenters voorbij? (en meer)

    Software & Development

    Niet-functionerend datawarehouse nekte Carpetright

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Planning
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2025 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs