Rechtszaken zijn nooit echt een liefdesfeest, maar de strijd om het auteursrecht tussen The New York Times en zowel OpenAI als Microsoft wordt bijzonder controversieel. Deze week beweerde de Times dat de technici van OpenAI per ongeluk gegevens hadden gewist waar het team van de krant meer dan 150 uur aan had gewerkt als potentieel bewijsmateriaal.
OpenAI kon een groot deel van de gegevens herstellen, maar het juridische team van de Times zegt dat de originele bestandsnamen en mapstructuur nog steeds ontbreken. Volgens een verklaring Woensdag ingediend bij de rechtbank door Jennifer B. Maisel, een advocaat van de krant, betekent dit dat de informatie “niet kan worden gebruikt om te bepalen waar de gekopieerde artikelen van de nieuwseisers” mogelijk zijn opgenomen in de kunstmatige intelligentiemodellen van OpenAI.
“We zijn het niet eens met de gemaakte karakteriseringen en zullen binnenkort met ons antwoord komen”, vertelde OpenAI-woordvoerder Jason Deutrom aan WIRED in een verklaring. De New York Times weigerde commentaar te geven.
The Times spande vorig jaar een auteursrechtzaak aan tegen OpenAI en Microsoft, waarbij ze beweerde dat de bedrijven hun artikelen illegaal hadden gebruikt om kunstmatige-intelligentietools zoals ChatGPT te trainen. De zaak is een van de vele lopende juridische gevechten tussen AI-bedrijven en uitgevers, waaronder een soortgelijke rechtszaak aangespannen door de Daily News die door enkele van dezelfde advocaten wordt behandeld.
De zaak van The Times is momenteel in onderzoek, wat betekent dat beide partijen gevraagde documenten en informatie overdragen die bewijsmateriaal kunnen worden. Als onderdeel van het proces werd OpenAI door de rechtbank verplicht om de trainingsgegevens aan de Times te tonen, wat een groot probleem is: OpenAI heeft nooit publiekelijk onthuld welke informatie precies werd gebruikt om zijn AI-modellen te bouwen. Om dit openbaar te maken creëerde OpenAI wat de rechtbank een “sandbox” van twee “virtuele machines” noemt, waar de advocaten van de Times doorheen konden bladeren. In haar verklaring zei Maisel dat OpenAI-ingenieurs de door het team van de Times georganiseerde gegevens op een van deze machines hadden ‘gewist’.
Volgens de documenten van Maisel erkende OpenAI dat de informatie was verwijderd en probeerde het probleem aan te pakken kort nadat het er eerder deze maand op werd gewezen. Maar toen de advocaten van de krant naar de ‘herstelde’ gegevens keken, was deze te ongeorganiseerd, waardoor ze ‘hun werk helemaal opnieuw moesten maken met aanzienlijke mensuren en computerverwerkingstijd’, zeiden verschillende andere advocaten van de Times in een brief ingediend bij de rechter op dezelfde dag als de aangifte van Maisel.
De advocaten merkten op dat ze “geen reden hadden om aan te nemen” dat de verwijdering “opzettelijk” was. In e-mails die samen met de brief van Maisel als bewijsstuk zijn ingediend, adviseert OpenAI Tom Gorman verwezen het wissen van de gegevens als een ‘glitch’ bestempelen.