Hiermee samenhangend:
Data Scientists, petabytes, exabytes, zettabytes, zettabyte
Meer uitleg:
Big Data wiki – een overvloed aan informatie
Big data is letterlijk vertaald ‘grote data’, oftewel een grote hoeveelheid aan data. Op Computable werd er in 2011 voor het eerst geschreven over big data. Om iets tot big data te rekenen moet data drie kenmerken bezitten, namelijk volume, variatie en snelheid (volume, variety & velocity). Daarnaast is de definitie van big data afhankelijk van datgene waar de focus op ligt. Zo kan je spreken over big data storage, maar ook over big data analytics. Bij big data storage gaat het over het opslaan van grote hoeveelheden ongestructureerde data. Big data analytics is een vorm van data warehousing en houdt in dat grote hoeveelheden gegevens worden geanalyseerd.
Volume, variety, velocity
Data moet aan drie dingen voldoen, om ‘big’ te worden genoemd. Ten eerste is het kernwoord hierbij volume: het meest aantrekkelijke aan big data is dat het zoveel data bevat dat er interessante informatie uit analyses daarvan kan worden gehaald. Hoe meer gegevens je hebt, hoe beter je op basis hiervan je namelijk voorspellingen kan doen. Een ander kenmerk van big data is dat er veel variatie in deze data zit. De data is opgehaald uit verschillende bronnen en is nog ongestructureerd. Ten slotte is er sprake van snelheid bij big data. Dit gaat over de snelheid waarmee data wordt verzameld. Mede door de toenemende hoeveelheid aan mobiele toestellen en sensoren die data verzamelen, groeit ook de hoeveelheid aan gegevens.
Big data als bedrijfswaarde
Een belangrijke reden waarom er veel aandacht voor big data is, heeft te maken met het analyseren van de data. Hoe meer data, hoe beter hier nuttige informatie hier uit kan worden gehaald. Klantgegevens kunnen worden gebruikt om te voorspellen wat hun volgende stap gaat zijn of om te weten waar het bedrijf op in kan spelen. Toch ontbreekt bij veel organisaties nog de kennis om data daadwerkelijk goed te analyseren, zo blijkt uit onderzoek. Veel organisaties weten niet waar ze moeten beginnen of welke vragen zij moeten stellen, waardoor big data analytics niet altijd succesvol in de praktijk wordt gebracht.
Big data storage
Deze enorme hoeveelheid aan data, die ook nog eens ongestructureerd is en ontzettend snel in hoeveelheid toeneemt, levert een aantal uitdagingen voor datastorage op. Niet alleen moet data worden gearchiveerd, maar moet ook onmiddellijk kunnen worden geanalyseerd. Een big data-opslagplatform moet aan een aantal eisen voldoen. Het moet kosteneffectief zijn, schaalbaarheid bieden, data verbinden, overal te benaderen zijn en een hoge beschikbaarheid hebben. Organisaties grijpen hierdoor steeds vaker naar cloudstorage oplossingen.
IT-security en big data
Aan de voordelen van big data zit echter ook een keerzijde. Juist door de enorme hoeveelheid aan data en de behoefte van bedrijven om verschillende databases aan elkaar te koppelen, kunnen hierdoor ook privacy-kwesties ontstaan. De data moet goed worden beveiligd om schadevergoedingen en imago-schade te voorkomen. Zeker met de huidige en komende streng dataprotectie-regelgeving.