Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Overzicht
    • Nieuws
    • Winnaars
    • Partner worden
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
  • Nieuwsbrief

Zijn schone gegevens belangrijk?

09 december 2004 - 23:003 minuten leestijdOpinieData & AI
Rick van der Lans
Rick van der Lans

In een van mijn vorige columns beschreef ik de mogelijke relatie tussen een service oriented architecture (soa) en een data warehouse. Veel services die wij uiteindelijk ontwikkelen, hebben een opvraagkarakter. De service moet de gevraagde gegevens dan ergens vandaan halen. De eerste gedachte is om die uit een bronsysteem te halen, maar waarom niet uit een data warehouse? Deze bevat immers opgeschoonde gegevens. Een ideale bron dus.

Een van de lezers was het daarmee oneens en schreef een nuttige reactie. Hij ging in op de vraag waar gegevens eigenlijk opgeschoond dienen te worden. Moeten we de bronsystemen zelf reinigen, moeten we ze pas reinigen als ze de operational data store (ODS) binnenkomen, of pas als ze het data warehouse instromen?
Het mooiste zou zijn als het reinigen bij de bronsystemen gebeurt. Hiervoor moeten twee exercities uitgevoerd worden. De gegevens moeten in de brondatabases gereinigd worden en de applicaties waarmee de gegevens ingevoerd worden, moeten onder handen genomen worden. Het moet moeilijker gemaakt worden voor gebruikers om incorrecte gegevens in te tikken (uiteraard zonder dat dit de gebruiksvriendelijkheid van de applicatie aantast). Doen we dit niet, dan blijft het opschonen dweilen met de kraan open.
Het aanpassen van bronsystemen is misschien wel de ideale oplossing, maar niet altijd mogelijk of gewenst. Niet elke organisatie staat te trappelen om oude bronsystemen aan te passen, omdat van sommige systemen geen documentatie meer bestaat, of omdat het aanpassen tot instabiliteit kan leiden. Als een aanpassing van bronsystemen vereist is, dan werpt dit een nog hogere drempel op om een data warehouse te gaan bouwen.
Vandaar dat veel organisaties ervoor kiezen om gegevens tijdens de kopieerslag van de bron naar de ODS of naar de data warehouse op te schonen. Het is daarmee ook een bewuste keuze om met twee inconsistente gegevensbronnen te werken: de niet-opgeschoonde bronsystemen en de wel opgeschoonde data warehouse.
Enkele organisaties besluiten om gegevens geheel niet op te schonen. De data warehouse geeft een beeld van de gegevens zoals ze in de bronsystemen opgeslagen zijn. Wel wordt er dan in de rapportage creatief met de cijfers gewerkt. Ze worden zodanig gemasseerd dat de rapporten er correct uitzien. In feite voert het rapportageproduct dan wat opschoningslagen uit. Niet ideaal, maar soms wel praktisch.
Waar en hoe een organisatie de defecte gegevens moet verbeteren, is afhankelijk van de wensen en eisen. Er is dus geen algemeen antwoord op deze vraag te geven. Het ligt aan de situatie.
Voor echte informatiefabrieken, zoals pensioen-, verzekeringsmaatschappijen en banken, zijn gegevens onmisbaar. Wat is bijvoorbeeld een pensioenmaatschappij nog waard wanneer we al hun gegevens zouden verwijderen? Uiteraard zijn hun kantoren ook wat waard, maar als we die weghalen, kan zo’n organisatie nog redelijk goed doorwerken. Gegevens zijn waarschijnlijk hun meest belangrijke bezit. Net zoals de voetballers van een professioneel voetbalteam van essentieel belang zijn, en het vrachtwagenpark dat voor een transportbedrijf is.
Bij elke informatiefabriek behoort gegevenskwaliteit hoog op de agenda te staan. Het opschonen van bronsystemen zal hier uitermate belangrijk zijn. Wat me soms wel verbaasd is dat voor sommige organisaties gegevens wel belangrijk zijn, maar dat ze die niet op de balans plaatsen. De vraag is dan hoe een dergelijke organisatie omgaat met gegevenskwaliteit.< BR>
 
Rick F. van der Lans is onafhankelijk adviseur, een internationaal bekend spreker en auteur van diverse boeken, tevens gespecialiseerd in softwareontwikkeling, datawarehousing en internet.

Meer over

ECMSOA

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Slim verbonden en veilig georganiseerd

    Waarom connectiviteit en security onlosmakelijk verbonden zijn.

    Computable.nl

    Beveiliging van AI in de praktijk

    AI is hot, maar de praktijk binnen grote organisaties blijkt weerbarstig. Stop met brandjes blussen; zo schaal en beveilig je met succes.

    Computable.nl

    Bouw de AI-organisatie niet op los zand

    Wat is de afweging tussen zelf bouwen of het benutten van cloud?

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Populaire berichten

    Meer artikelen

    Uitgelicht

    Partnerartikel
    Data & AI

    AI in softwaretesten: tussen belofte e...

    De opkomst van kunstmatige intelligentie (AI) wekte hoge verwachtingen in de wereld van softwaretesten. Zelflerende testsuites, automatisch gegenereerde testgevallen en...

    Meer persberichten

    Meer lezen

    ai in de zorg
    Overheid

    Slimme zorg vraagt om slimme data: VWS bouwt versneld aan ai-infrastructuur

    ai klusjes gig
    Data & AI

    Kort: Java en ai-tools vernieuwd, klusjes scoren (en meer)

    ai
    Data & AI

    VS nog op kop in ai-race, maar China wil meer riskeren voor opschalen

    Carrière

    Deloitte: geen verband tussen inzet ai en personeelskrimp

    Data & AI

    Kort: Innobrix wint Google-prijs, anonieme ai helpt zorg nog meer (en nog meer)

    Agent op zoek naar productinfo
    Data & AI

    Productinformatie-leverancier Icecat introduceert MCP-connector voor ai-agents

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Planning
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2025 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs