Een AI-model is getraind op basis van heel veel digitaal materiaal. Hoe beter het trainingsmateriaal, hoe beter de output. Moderne LLM’s verslinden met gemak vele terabytes aan tekst.
Maar beschikbaar wil niet zeggen rechtenvrij. OpenAI, een van de meest prominente namen in de AI-wereld, bevindt zich momenteel in het middelpunt van een zeer interessant juridisch gevecht vanwege het gebruik van auteursrechtelijk beschermd trainingsmateriaal. Verschillende auteurs en uitgevers beweren dat hun werken zonder toestemming zijn gebruikt. Dat is niet vreemd als je je bedenkt dat de meeste grote techbedrijven privacy en auteursrecht zien als obstakels die je pas als het echt niet anders kan moet respecteren.
Groot belang voor beide partijen
Een uitspraak in deze rechtszaak heeft grote gevolgen voor beide partijen. ChatGTP is zeer gebaat bij trainingsmateriaal dat voldoende feitelijk en taalkundig correct is. Iets waar de gemiddelde blog of LinkedIn-post niet aan voldoet, maar een krant als de New York Times wel. Mocht OpenAI auteursrechtelijk beschermd materiaal niet mogen gebruiken, dan zal het alle AI-modellen opnieuw moeten trainen. Zodra de soep klaar is, is het immers onmogelijk om het zout eruit te verwijderen.
Uitgeverijen en auteurs aan de andere kant zien hun dure content gebruikt worden voor de training van tools die hun eigen platforms buiten spel zetten. In de toekomst zullen websites als Google search in een chat-achtige opzet direct antwoord geven en hierdoor minder doorverwijzen naar externe websites. Dat zet het huidige advertentie-verdienmodel voor uitgevers onder druk.
Welk deel van content is auteursrechtelijk beschermd?
Deze juridische strijd werpt een interessante en cruciale vraag op: is het gebruik van auteursrechtelijk beschermd materiaal in AI-training een schending van het auteursrecht, of is het een legitieme poging om de regels van de menselijke taal te begrijpen en de mensheid beter van dienst te zijn?
OpenAI verdedigt zich krachtig tegen de aanklachten. Hoe kan het ook anders. Zij beweren dat het gebruik van auteursrechtelijk beschermd materiaal in AI-training geen schending van het auteursrecht is, omdat het uiteindelijke doel is om de regels van de menselijke taal te begrijpen en niet om te profiteren van dat materiaal in de zin van context. Een belangrijk onderdeel van OpenAI's verdediging is de verwijzing naar de Google Books-zaak. In deze zaak werd vastgesteld dat het verzamelen van statistische informatie over woordfrequenties en thematische markeringen in boeken geen schending van het auteursrecht was, omdat het als transformatief werd beschouwd en hierdoor buiten de reikwijdte van auteursrechtelijke bescherming viel.
De kern van OpenAI's argument is dat het gebruik van auteursrechtelijk beschermd materiaal in AI-training een manier is om de menselijke taal te begrijpen en te verbeteren, en dat dit geen inkomsten oplevert voor OpenAI of enige andere vorm van directe winst uit het gebruik van dit materiaal. Direct misschien niet, maar indirect zal het in ieder geval geen windeieren leggen.
Opzoeken van grenzen in het recht
De juridische strijd tussen OpenAI en auteurs wijst op de grijze gebieden die ontstaan door technologische ontwikkelingen. Het is slechts een van de vele voorbeelden waarin technologische doorbraken nieuwe ethische en juridische vraagstukken oproepen. Vaak zoeken game changers bewust deze grenzen op en proberen deze op te rekken. Denk aan bedrijven zoals Uber en Tesla, die respectievelijk de taxi-industrie en de zelfrijdende auto-industrie hebben verstoord. Bij hun opkomst werden veel van hun praktijken als mogelijk illegaal beschouwd. Uiteindelijk groeien technische mogelijkheden, publieke opinie en recht naar elkaar toe.
Wat deze juridische strijd zo complex maakt, is het feit dat er geen eenduidig antwoord is. De wetgeving met betrekking tot AI en auteursrecht is nog in ontwikkeling en zal zich ook moeten aanpassen aan de snel veranderende technologische omgeving. Wat vandaag als schending van het auteursrecht kan worden beschouwd, kan morgen als legitiem worden beschouwd als de wet evolueert.
Ik denk dat AI veel te invloedrijk (op een positieve manier) kan worden en dat het niet beperkt moet worden door het auteursrecht. We praten hier ook over bijvoorbeeld medische toepassingen en als we de AI gaan beperken op die manier dan zorgen we er ook voor dat bepaalde oplossingen nooit ontdekt zullen worden.