Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
  • Nieuwsbrief

Stichting Brein haalt ai-training-dataset offline 

14 augustus 2024 - 10:28ActueelData & AIStichting Brein
Alfred Monterie
Alfred Monterie

Wegens grootschalige inbreuk op auteursrechten heeft de Stichting Brein een omvangrijke Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (ai) modellen te trainen. Dit is de eerste keer dat zo’n actie in Nederland plaatsvindt.

Na een tip ontdekte Brein dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door ai-computermodellen zoals large language models (llm’s). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook ‘datamining’ uit illegale bron is nooit toegestaan. Dit kan alleen met toestemming van de houders van de auteursrechten.

Auteursrechten

Generatieve ai-modellen moeten van tevoren worden getraind met grote datasets. Vaak zitten daar auteursrechten of andere rechten van intellectueel eigendom op. In het Verenigd Koninkrijk heeft Getty Images al een rechtszaak tegen Stability AI aangespannen wegens het vermeend schenden van deze rechten. In de VS lopen om dezelfde reden al verschillende zaken tegen OpenAI’s ChatGPT en Meta’s Llama. Die modellen zouden met illegaal verkregen materiaal zijn getraind.

Bastiaan van Ramshorst, directeur van Stichting Brein, zegt op te treden tegen inbreukmakend en onrechtmatig gebruik van ai. ‘We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan tienduizend  resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrecht-voorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel.’

Geen inbreuk meer

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. Brein onderzoekt nu welke ai-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt Brein aan dat rechthebbenden een voorbehoud maken. Veel bij deze stichting aangesloten rechthebbenden doen dit al.

Meer over

Datamining

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Computable.nl

    Trek AI uit de experimenteerfase

    Een gids over AI als strategisch instrument en op welke manier je écht waarde toevoegt aan je organisatie.

    Computable.nl

    Slim verbonden en veilig georganiseerd

    Waarom connectiviteit en security onlosmakelijk verbonden zijn.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Populaire berichten

    Meer artikelen

    Uitgelicht

    Partnerartikel
    Security & Awareness

    NIS2: Europese richtlijn maakt cyberse...

    De Europese NIS2-richtlijn zet cybersecurity definitief op de strategische agenda. Organisaties in vitale sectoren krijgen te maken met strengere eisen...

    Meer persberichten

    Meer lezen

    Mitz sprong in het diepe cloud 'Trust Us'
    Governance & Privacy

    Kort: Ondanks risico’s toch meer apotheken bij Mitz, Frontria tegen fake news door ai (en meer)

    Cloud & Infrastructuur

    Groningse ai-fabriek krijgt voor 150 miljoen aan hardware

    datacenter arbeidsmarkt jobs
    Data & AI

    Kort: 150-megawatt-datacenter in Lelystad, Nederlandse ict-sector verwacht groei (en meer)

    Data & AI

    Slimmer eten, minder verspillen

    Cloud & Infrastructuur

    Kort: Evides selecteert Digital Survival Company en KPMG in zee met Databricks (en meer)

    eEvidence shoot first
    Governance & Privacy

    eEvidence: goodbye privacy, vaarwel digitale soevereiniteit

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Planning
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2025 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs