Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
    • Inzendingen
    • De jury en experts
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
    • Magazine
    • Adverteren in het magazine
  • Nieuwsbrief

Stichting Brein haalt ai-training-dataset offline 

14 augustus 2024 - 10:28ActueelData & AIStichting Brein
Alfred Monterie
Alfred Monterie

Wegens grootschalige inbreuk op auteursrechten heeft de Stichting Brein een omvangrijke Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (ai) modellen te trainen. Dit is de eerste keer dat zo’n actie in Nederland plaatsvindt.

Na een tip ontdekte Brein dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door ai-computermodellen zoals large language models (llm’s). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook ‘datamining’ uit illegale bron is nooit toegestaan. Dit kan alleen met toestemming van de houders van de auteursrechten.

Auteursrechten

Generatieve ai-modellen moeten van tevoren worden getraind met grote datasets. Vaak zitten daar auteursrechten of andere rechten van intellectueel eigendom op. In het Verenigd Koninkrijk heeft Getty Images al een rechtszaak tegen Stability AI aangespannen wegens het vermeend schenden van deze rechten. In de VS lopen om dezelfde reden al verschillende zaken tegen OpenAI’s ChatGPT en Meta’s Llama. Die modellen zouden met illegaal verkregen materiaal zijn getraind.

Bastiaan van Ramshorst, directeur van Stichting Brein, zegt op te treden tegen inbreukmakend en onrechtmatig gebruik van ai. ‘We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan tienduizend  resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrecht-voorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel.’

Geen inbreuk meer

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. Brein onderzoekt nu welke ai-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt Brein aan dat rechthebbenden een voorbehoud maken. Veel bij deze stichting aangesloten rechthebbenden doen dit al.

Meer over

Datamining

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Geïntegreerde ICT in de zorg

    Hoe samenhang in IT bijdraagt aan continuïteit en veiligheid

    Computable.nl

    Agentic AI in de praktijk

    Hoe autonome AI werkprocessen fundamenteel verandert

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Awards-inzendingen

    Pijl naar rechts icoon

    Cegeka

    Ammar Alkhatib (Cyber Security Advisor, Cegeka)
    Pijl naar rechts icoon

    Prometheus Informatics B.V.

    Duurzamer, veiliger én voordeliger rijden bij Bouw Logistics Services (Bouw Logistics Services en Prometheus Informatics)
    Pijl naar rechts icoon

    Prometheus Informatics B.V.

    Sturen op duurzaamheidsdoelstellingen bij Rabelink Logistics (Rabelink Logistics en Prometheus Informatics)
    Pijl naar rechts icoon

    Searoutes

    CO₂-transparantie voor digitale freight forwarding bij Shypple (Shypple en Searoutes)
    Pijl naar rechts icoon

    INNO-WAY Rabotics

    Verkoopstijgingen behaald van 100% op geselecteerde producten en meer klanten geholpen bij Gamma (GAMMA en INNO-WAY)
    Alle inzendingen
    Pijl naar rechts icoon

    Populaire berichten

    Meer artikelen

    Meer lezen

    Data & AI

    Kort: Anthropic bang van zich zelf, verouderde facturatie werkt wanbetaling in de hand (en meer)

    Claude
    Data & AI

    Met code als motor: de onstuitbare opmars van Anthropic

    Data & AI

    IO integreert Mistral in eigen Bonzai-platform

    cloudsoevereiniteit EU
    Cloud & Infrastructuur

    Techwereld vrij positief over Europese pakket voor digitale soevereiniteit

    Data & AI

    Van ventilator naar vloeistof

    Financiële dienstverlening

    ING en Worldline voeren eerste Europese agentic betaling in productie uit

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2026 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs