Computable.nl
  • Thema’s
    • Carrière
    • Innovatie & Transformatie
    • Cloud & Infrastructuur
    • Data & AI
    • Governance & Privacy
    • Security & Awareness
    • Software & Development
    • Werkplek & Beheer
  • Sectoren
    • Channel
    • Financiële dienstverlening
    • Logistiek
    • Onderwijs
    • Overheid
    • Zorg
  • Computable Awards
    • Overzicht
    • Nieuws
    • Winnaars
    • Partner worden
  • Vacatures
    • Vacatures bekijken
    • Vacatures plaatsen
  • Bedrijven
    • Profielen
    • Producten & Diensten
  • Kennisbank
  • Nieuwsbrief

Stichting Brein haalt ai-training-dataset offline 

14 augustus 2024 - 10:28ActueelData & AIStichting Brein
Alfred Monterie
Alfred Monterie

Wegens grootschalige inbreuk op auteursrechten heeft de Stichting Brein een omvangrijke Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (ai) modellen te trainen. Dit is de eerste keer dat zo’n actie in Nederland plaatsvindt.

Na een tip ontdekte Brein dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door ai-computermodellen zoals large language models (llm’s). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook ‘datamining’ uit illegale bron is nooit toegestaan. Dit kan alleen met toestemming van de houders van de auteursrechten.

Auteursrechten

Generatieve ai-modellen moeten van tevoren worden getraind met grote datasets. Vaak zitten daar auteursrechten of andere rechten van intellectueel eigendom op. In het Verenigd Koninkrijk heeft Getty Images al een rechtszaak tegen Stability AI aangespannen wegens het vermeend schenden van deze rechten. In de VS lopen om dezelfde reden al verschillende zaken tegen OpenAI’s ChatGPT en Meta’s Llama. Die modellen zouden met illegaal verkregen materiaal zijn getraind.

Bastiaan van Ramshorst, directeur van Stichting Brein, zegt op te treden tegen inbreukmakend en onrechtmatig gebruik van ai. ‘We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan tienduizend  resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrecht-voorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel.’

Geen inbreuk meer

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. Brein onderzoekt nu welke ai-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt Brein aan dat rechthebbenden een voorbehoud maken. Veel bij deze stichting aangesloten rechthebbenden doen dit al.

Meer over

Datamining

Deel

    Inschrijven nieuwsbrief Computable

    Door te klikken op inschrijven geef je toestemming aan Jaarbeurs B.V. om je naam en e-mailadres te verwerken voor het verzenden van een of meer mailings namens Computable. Je kunt je toestemming te allen tijde intrekken via de af­meld­func­tie in de nieuwsbrief.
    Wil je weten hoe Jaarbeurs B.V. omgaat met jouw per­soons­ge­ge­vens? Klik dan hier voor ons privacy statement.

    Whitepapers

    Computable.nl

    Bouw de AI-organisatie niet op los zand

    Wat is de afweging tussen zelf bouwen of het benutten van cloud?

    Computable.nl

    De weg van dataverzameling naar impact

    Iedere organisatie heeft data, maar niet iedereen weet hoe je het goed gebruikt. Hoe zet je waardevolle informatie om in actie?

    Computable.nl

    In detail: succesvolle AI-implementaties

    Het implementeren van kunstmatige intelligentie (AI) biedt enorme kansen, maar roept ook vragen op. Deze paper beschrijft hoe je als (middel)grote organisatie klein kunt starten met AI en gaandeweg kunnen opschalen.

    Meer lezen

    ActueelInnovatie & Transformatie

    Apple bepaald geen voorloper met ai

    OpinieData & AI

    Maak ai saai!

    ActueelData & AI

    Cisco sorteert voor op komst van ai-agenten

    AchtergrondData & AI

    Nvidia lanceert 20 nieuwe ai-fabrieken in Europa, maar passeert Nederland

    ActueelCarrière

    Kort nieuws: Netcompany verhuist naar de Hofstad, meer omzet Besi, Fugaku snelste super (en meer)

    Gemeentehuis
    ActueelData & AI

    Ook gemeente Emmen start met ai-systeem voor raadsinformatie

    Geef een reactie Reactie annuleren

    Je moet ingelogd zijn op om een reactie te plaatsen.

    Populaire berichten

    Meer artikelen

    Uitgelicht

    Partnerartikel
    AdvertorialInnovatie & Transformatie

    Computable Insights

    Een ai-agent die klantvragen afhandelt. Dat is een van de nieuwste troeven van softwareproducent Salesforce, dat daarmee meesurft op de...

    Meer persberichten

    Footer

    Direct naar

    • Carrièretests
    • Kennisbank
    • Planning
    • Computable Awards
    • Magazine
    • Abonneren Magazine
    • Cybersec e-Magazine

    Producten

    • Adverteren en meer…
    • Jouw Producten en Bedrijfsprofiel
    • Whitepapers & Leads
    • Vacatures & Employer Branding
    • Persberichten

    Contact

    • Colofon
    • Computable en de AVG
    • Service & contact
    • Inschrijven nieuwsbrief
    • Inlog

    Social

    • Facebook
    • X
    • LinkedIn
    • YouTube
    • Instagram
    © 2025 Jaarbeurs
    • Disclaimer
    • Gebruikersvoorwaarden
    • Privacy statement
    Computable.nl is een product van Jaarbeurs