Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Awards
    • Computable Awards
    • Nieuws
    • Winnaars
    • Partner worden
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Magazine
  • Nieuwsbrief

Stichting Brein haalt ai-training-dataset offline 

14 augustus 2024 - 10:28ActueelData & AIStichting Brein
Alfred Monterie
Alfred Monterie

Wegens grootschalige inbreuk op auteursrechten heeft de Stichting Brein een omvangrijke Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (ai) modellen te trainen. Dit is de eerste keer dat zo’n actie in Nederland plaatsvindt.

Na een tip ontdekte Brein dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door ai-computermodellen zoals large language models (llm’s). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook ‘datamining’ uit illegale bron is nooit toegestaan. Dit kan alleen met toestemming van de houders van de auteursrechten.

Auteursrechten

Generatieve ai-modellen moeten van tevoren worden getraind met grote datasets. Vaak zitten daar auteursrechten of andere rechten van intellectueel eigendom op. In het Verenigd Koninkrijk heeft Getty Images al een rechtszaak tegen Stability AI aangespannen wegens het vermeend schenden van deze rechten. In de VS lopen om dezelfde reden al verschillende zaken tegen OpenAI’s ChatGPT en Meta’s Llama. Die modellen zouden met illegaal verkregen materiaal zijn getraind.

Bastiaan van Ramshorst, directeur van Stichting Brein, zegt op te treden tegen inbreukmakend en onrechtmatig gebruik van ai. ‘We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan tienduizend  resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrecht-voorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel.’

Geen inbreuk meer

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. Brein onderzoekt nu welke ai-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt Brein aan dat rechthebbenden een voorbehoud maken. Veel bij deze stichting aangesloten rechthebbenden doen dit al.

Meer over

Datamining

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    De toekomst van serverbeheer. Nieuwe eisen aan prestaties en beveiliging.

    Computable.nl

    Ontdek hoe je de kracht van private cloud kunt ontgrendelen

    Nieuwe eisen aan prestaties en beveiliging. De toekomst van serverbeheer.

    Computable.nl

    Trek AI uit de experimenteerfase

    Een gids over AI als strategisch instrument en op welke manier je écht waarde toevoegt aan je organisatie.

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Populaire berichten

    Meer artikelen

    Uitgelicht

    Partnerartikel
    Security & Awareness

    De noodzaak van OT-cybersecurity en de...

    ‘Wat je niet weet, kan het meeste zeer doen’ De Europese Unie scherpt de cyberwetgeving stevig aan. Met de nieuwe...

    Meer persberichten

    Meer lezen

    Data & AI

    Spoelstra Spreekt: Gokje

    admin luie hacker
    Security & Awareness

    Kort: Luie hacker start met ‘admin’, ai-platform voor notarissen (en meer)

    Carrière

    Bliksemstart voor AI House Amsterdam

    Data & AI

    Met ai en api’s tijdwinst pakken

    Overheid

    ‘Nederlandse Digitaliseringsstrategie gaat zeker één miljard per jaar kosten’

    Innovatie & Transformatie

    Europa, laat je niet opnieuw gijzelen door technologie

    ...

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Planning
    • Computable Awards
    • Magazine
    • Ontvang Computable e-Magazine
    • Cybersec e-Magazine
    • Topics
    • Phishing
    • Ransomware
    • NEN 7510

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2025 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs