Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
    • Inzending indienen
    • Inzendingen
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
    • Magazine
    • Adverteren in het magazine
  • Nieuwsbrief

Stichting Brein haalt ai-training-dataset offline 

14 augustus 2024 - 10:28ActueelData & AIStichting Brein
Alfred Monterie
Alfred Monterie

Wegens grootschalige inbreuk op auteursrechten heeft de Stichting Brein een omvangrijke Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (ai) modellen te trainen. Dit is de eerste keer dat zo’n actie in Nederland plaatsvindt.

Na een tip ontdekte Brein dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door ai-computermodellen zoals large language models (llm’s). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook ‘datamining’ uit illegale bron is nooit toegestaan. Dit kan alleen met toestemming van de houders van de auteursrechten.

Auteursrechten

Generatieve ai-modellen moeten van tevoren worden getraind met grote datasets. Vaak zitten daar auteursrechten of andere rechten van intellectueel eigendom op. In het Verenigd Koninkrijk heeft Getty Images al een rechtszaak tegen Stability AI aangespannen wegens het vermeend schenden van deze rechten. In de VS lopen om dezelfde reden al verschillende zaken tegen OpenAI’s ChatGPT en Meta’s Llama. Die modellen zouden met illegaal verkregen materiaal zijn getraind.

Bastiaan van Ramshorst, directeur van Stichting Brein, zegt op te treden tegen inbreukmakend en onrechtmatig gebruik van ai. ‘We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan tienduizend  resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrecht-voorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel.’

Geen inbreuk meer

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. Brein onderzoekt nu welke ai-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt Brein aan dat rechthebbenden een voorbehoud maken. Veel bij deze stichting aangesloten rechthebbenden doen dit al.

Meer over

Datamining

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Agentic AI in de praktijk

    Hoe autonome AI werkprocessen fundamenteel verandert

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Computable.nl

    Trek AI uit de experimenteerfase

    Een gids over AI als strategisch instrument en op welke manier je écht waarde toevoegt aan je organisatie.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Awards-inzendingen

    Pijl naar rechts icoon

    Ecare Software

    Gestandaardiseerde huisartscommunicatie vanuit PUUR.: sneller, veiliger en zorginstelling-overstijgend (PUUR en Ecare)
    Pijl naar rechts icoon

    Ecare Software

    PUUR. integreert met SUP: minder administratie, meer tijd voor zorg (PUUR. SUP en Ecare)
    Pijl naar rechts icoon

    Emixa B.V

    Van 3 weken naar 3 dagen: hoe Kornelis de doorlooptijd met 85% verbetert (Emixa)
    Pijl naar rechts icoon

    ESC Holding

    Digitalisering van analoge bouwtekeningen en registraties infrastructuursystemen bij Brabant Water (Brabant Water en ESC Holding)
    Pijl naar rechts icoon

    Esri Nederland

    Provincies Noord- en Zuid-Holland krijgen grip op ruimtelijke opgaven met ArcGIS (provincie Noord-Holland, provincie Zuid-Holland, ArcGIS en ArcGISEsri)
    Alle inzendingen
    Pijl naar rechts icoon

    Populaire berichten

    Meer artikelen

    Meer lezen

    Data & AI

    Slackbot krijgt ruim dertig nieuwe functies

    Cloud & Infrastructuur

    Kort: Twee datablunders Anthropic in één week, vernieuwde HP LaserJet‑lijn (en meer)

    Carrière

    Oracle jaagt personeel stuipen op lijf met ontslaggolf 

    Data & AI

    Kort: Full Join sorteert voor op post-quantumbeveiliging, Sodexo halveert foodwaste dankzij data (en meer)

    Data & AI

    Spoelstra Spreekt: We zijn er bijna

    Data & AI

    Kabinet steekt geen geld in Rotterdamse ai-gigafabriek

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2026 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs