Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
    • Inzending indienen
    • Inzendingen
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
    • Magazine
    • Adverteren in het magazine
  • Nieuwsbrief

Alles voor data: van warehouse tot data-mart

24 juli 2024 - 10:563 minuten leestijdAchtergrondData & AIML6
William Visterin
William Visterin

De data-aanpak in organisaties kan danig verschillen. We overlopen de belangrijkste concepten en termen – en starten bij datawarehouse om via een data-lake over te gaan tot recente termen. ‘Het verschil zit ‘m in het soort data en scope.’

Welkom het het eerste deel in het grote overzicht van dataconcepten. Want hoe meer data, hoe beter.

1. Datawarehouse

Bij een datawarehouse gaat het om het opslaan van gestructureerde (relationele) data. ‘Dus met een vooraf bepaald formaat, soorten velden,…’, illustreert Edle Everaert, die tot voor kort hoofd van de afdeling ai business consulting was bij ML6. ‘Doorgaans zijn deze data afkomstig uit bestaande operationele systemen, zoals transactiedata, klantdata of product data.’

De data worden periodiek naar het datawarehouse opgeladen, via een batchproces, waarbij tijdens het ophalen en opslaan van de data de opgelegde en verwachte structuur gecontroleerd en waar nodig afgedwongen wordt. Indien nodig worden de gegevens bewerkt. De data in een datawarehouse worden vervolgens doorgaans gebruikt voor rapportage. ‘Waarbij data-specialisten en business-analisten verantwoordelijkheid dragen voor het aanmaken en onderhouden van die rapportages’, aldus Everaert. ‘Het gebruik van de data in een datawarehouse is dus doorgaans op voorhand bepaald, en op basis van het beoogde gebruik wordt bepaald welke data er nodig zijn in het datawarehouse.’

Datawarehouses gaan al even mee. Ze zijn nog steeds van tel, al zijn er alternatieve benaderingen. Een datawarehouse is volgens Everaert een eerder complexe en dure oplossing om verder op te schalen. ‘Zeker wanneer er nieuwe types data toegevoegd moeten worden’, stelt ze. ‘Het voordeel is het snel aanmaken van rapporten en het uitvoeren van ad hoc queries binnen de vooraf bepaalde data scope, en de hoge datakwaliteit.’

2. Data-lake

Bij een data-lake gaat het om het opslaan van zowel gestructureerde als ongestructureerde data, en dat uit verschillende soorten bronnen of operationele systemen. ‘Maar ook data afkomstig van bijvoorbeeld sociale media, webpagina’s of internet of things-apparaten. Het kan daarbij gaan om cijfers, tekst, beelden, geluid of andere.’

Alle data worden opgeslagen in hun oorspronkelijke formaat, zonder bewerking of aanpassingen. Naast dat oorspronkelijke formaat (raw data) worden er doorgaans ook extra lagen voorzien met opgekuiste data en geselecteerde data (curated data met bijvoorbeeld enkel gevalideerde bronnen). ‘Gelet op het soort bronnen gebeurt het opladen van de data continue, het zogenaamde streaming.’

De brede waaier aan data die in een data-lake verzameld wordt, is op uiteenlopende manier te gebruiken, waarbij gebruikssituaties niet op voorhand vastliggen. ‘Hier komt ai en machine learning in beeld, die dit soort grote databronnen met ongestructureerde data nodig hebben om hun sterkte te tonen’, merkt Everaert op.

Het nadeel van een data-lake in deze definitie zit volgens haar in het risico op problemen rond datakwaliteit, data-security bij gevoelige data, complexiteit in beheer, en eventuele performanceproblemen gezien de volumes. ‘Het voordeel zit in het volume aan data dat is op te slaan op een kostenefficiënte manier, de zogenaamde big data, en de flexibiliteit in soorten data.’

3. Data-mart

Een data-mart hangt nauw samen met een datawarehouse. Vaak wordt het omschreven als een eenvoudige vorm van een datawarehouse gericht op een onderwerp of bedrijfstak, zoals verkoop, financiën of marketing.

Everaert ziet in de data-mart een fundamenteel verschil met een datawarehouse. ‘Het heeft hetzelfde soort data, focus op structureren van de data, en vooraf bepaald gebruik’, weet ze. ‘Het verschil zit ‘m in de scope, waarbij een data-mart een meer beperkte scope heeft, om nog sneller te kunnen werken.’


(In deel 2 van deze minireeks meer over de termen: data-lakehouse, data-mesh en data-fabric.)

Meer over

Datamanagement

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Geïntegreerde ICT in de zorg

    Hoe samenhang in IT bijdraagt aan continuïteit en veiligheid

    Computable.nl

    Agentic AI in de praktijk

    Hoe autonome AI werkprocessen fundamenteel verandert

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Awards-inzendingen

    Pijl naar rechts icoon

    Prometheus Informatics B.V.

    Duurzamer, veiliger én voordeliger rijden bij Bouw Logistics Services (Bouw Logistics Services en Prometheus Informatics)
    Pijl naar rechts icoon

    Prometheus Informatics B.V.

    Sturen op duurzaamheidsdoelstellingen bij Rabelink Logistics (Rabelink Logistics en Prometheus Informatics)
    Pijl naar rechts icoon

    Hyperfox

    Vereenvoudiging besteloroces bij Duplast, specialist in voedselverpakkingen (Duplast en Hyperfox)
    Pijl naar rechts icoon

    Prodek Solutions BV

    Compleet pakket voor digitale aansturing duurzame energie bij Odura (Odura en Prodek Solutions)
    Pijl naar rechts icoon

    Norday

    AI-tool die hyper-gepersonaliseerde cultuurpodcasts maakt voor het Rotterdams Philharmonisch Orkest (Wondercast)
    Alle inzendingen
    Pijl naar rechts icoon

    Populaire berichten

    Meer artikelen

    Meer lezen

    Innovatie & Transformatie

    Onderzoek naar lasergebaseerde 3d-printen onder water

    Carrière

    Massa-ontslagen bij Meta en Microsoft als gevolg van ai

    Innovatie & Transformatie

    Europa blijft hangen in industrie-erfenis, digitalisering fabriek stokt

    Overheid

    Kort: Kabinet trekt stekker uit NDS-raad, breedbandmarkt groeit door (en meer)

    shutterstock_2726036819 Ivan Marc
    Data & AI

    Kort: EU-regeldruk leidt tot id-hub, Gartner verwacht groei wereldwijde it-bestedingen (en meer)

    Data & AI

    Tien toezichthouders bewaken naleving ai-verordening

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2026 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs