Advocaten voor de eisers in een auteursrechtszaak tegen Meta beweren dat Meta CEO Mark Zuckerberg groen licht gaf aan het team dat verantwoordelijk is voor de Llama AI-modellen van het bedrijf om een dataset van gestolen e-books en artikelen te gebruiken voor training.

    De zaak, Kadrey v. Meta, is een van de vele tegen techgiganten die AI ontwikkelen en beschuldigen de bedrijven ervan modellen te trainen op auteursrechtelijk beschermd werk zonder toestemming. In de meeste gevallen beweren verdachten zoals Meta dat ze beschermd zijn door rechtvaardig gebruik, de Amerikaanse juridische doctrine die het gebruik van auteursrechtelijk beschermd werk toestaat om iets nieuws te maken, zolang het voldoende transformerend is. Veel creatoren wijzen dat argument van de hand.

    In recent onthulde documenten die woensdag laat zijn ingediend bij de U.S. District Court voor het Northern District of California, beschrijven de eisers in Kadrey v. Meta, waaronder de bestsellerauteurs Sarah Silverman en Ta-Nehisi Coates, de getuigenis van Meta van eind vorig jaar, waarin werd onthuld dat Zuckerberg goedkeuring gaf voor het gebruik van een dataset genaamd LibGen voor training gerelateerd aan Llama.

    LibGen, dat zichzelf beschrijft als een “links aggregator”, biedt toegang tot auteursrechtelijk beschermde werken van uitgevers zoals Cengage Learning, Macmillan Learning, McGraw Hill en Pearson Education. LibGen is verschillende keren aangeklaagd, gedwongen om te sluiten en beboet met tientallen miljoenen dollars voor auteursrechtinbreuk.

    Volgens de getuigenis van Meta, zoals verteld door de advocaten van de eisers, gaf Zuckerberg toestemming voor het gebruik van LibGen om ten minste een van Meta’s Llama-modellen te trainen, ondanks zorgen binnen het AI-executiveteam van Meta en anderen bij het bedrijf. De indiening quote Meta-medewerkers die LibGen verwijzen als een “dataset waarvan we weten dat deze gestolen is,” en die signaleren dat het gebruik “de onderhandelingspositie van [Meta] met regelgevers kan ondermijnen.”

    See also  Andreessen Horowitz assists founders in meeting compute demands with ‘Oxygen’ private GPU cluster

    De indiening verwijst ook naar een memo aan de beslissers van Meta AI waarin staat dat, na “escalatie naar MZ,” het AI-team van Meta “[was] goedgekeurd om LibGen te gebruiken.” (MZ is hier een overduidelijke afkorting voor “Mark Zuckerberg.”)

    De details lijken overeen te komen met rapportage van The New York Times afgelopen april, die suggereerde dat Meta korter op de bal speelde om data voor zijn AI te verzamelen. Op een gegeven moment huurde Meta contractanten in Afrika in om samenvattingen van boeken te verzamelen en overwoog de uitgever Simon & Schuster te kopen, volgens de Times. Maar de leidinggevenden van het bedrijf kwamen tot de conclusie dat het te lang zou duren om licenties te onderhandelen en redeneerden dat rechtvaardig gebruik een solide verdediging was.

    De indiening van woensdag bevat nieuwe beschuldigingen, zoals dat Meta mogelijk geprobeerd heeft zijn vermeende inbreuk te verbergen door de LibGen-data ontdaan van toeschrijving.

    Volgens de advocaten van de eisers, schreef Meta-ingenieur Nikolay Bashlykov, die werkt aan het Llama-onderzoeksteam, een script om auteursrechtelijke informatie te verwijderen, inclusief het woord “auteursrecht” en “erkenningen,” uit e-books in LibGen. Apart daarvan zou Meta naar verluidt ook auteursrechtmarkeringen van artikelen in wetenschappelijke tijdschriften en “bronmetadata” hebben verwijderd in de trainingsdata die het gebruikte voor Llama.

    “Deze ontdekking suggereert dat Meta [auteursrechtinformatie] niet alleen verwijdert voor trainingsdoeleinden,” luidt de indiening, “maar ook om zijn auteursrechtinbreuk te verbergen, omdat het verwijderen van auteursrechtelijk beschermd werk … voorkomt dat Llama auteursrechtinformatie genereert die Llama-gebruikers en het publiek kan waarschuwen voor Meta’s inbreuk.”

    See also  Director Morgan Neville avoids generative AI following ‘Roadrunner’ controversy

    Volgens de laatste indiening bleek ook dat Meta tijdens getuigenis heeft verklaard dat het LibGen via torrents heeft gedownload, een stap die sommige Meta-onderzoekingen twijfels opriep. Torrenting, een manier om bestanden over het web te verspreiden, vereist dat torrenters gelijktijdig “seeden,” ofwel de bestanden uploaden die ze proberen te verkrijgen.

    De advocaten van de eisers beweren dat Meta daadwerkelijk betrokken was bij een andere vorm van auteursrechtinbreuk door LibGen via torrents te downloaden en zo te helpen de inhoud ervan te verspreiden. Meta zou ook hebben geprobeerd zijn activiteiten te verbergen, aldus de advocaten, door het aantal bestanden dat het uploadde te minimaliseren.

    Volgens de indiening “ruimde” Meta’s hoofd van generatieve AI, Ahmad Ah-Dahle, de weg voor het torrenten van LibGen — negeerde Bashlykov’s bedenkingen dat het misschien “juridisch niet oké” zou zijn.

    “Als Meta de werken van de eisers in een boekwinkel had gekocht of ze van een bibliotheek had geleend en zijn Llama-modellen erop had getraind zonder een licentie, zou het auteursrechtinbreuk hebben gepleegd,” schreven de advocaten van de eisers in de indiening. “Meta’s beslissing om wettelijke methoden voor het verkrijgen van boeken te omzeilen en een wetende deelnemer te worden in een illegaal torrentnetwerk … dient als bewijs van auteursrechtinbreuk.”

    De zaak tegen Meta is verre van beslist. Voorlopig heeft het alleen betrekking op Meta’s vroegste Llama-modellen — niet op de recente releases. En de rechtbank kan mogelijk in het voordeel van Meta beslissen als ze door het argument van rechtvaardig gebruik van het bedrijf is overtuigd.

    See also  Meta voegt 200 megawatt zonne-energie toe aan zijn 12 gigawatt duurzame portfolio

    Maar de beschuldigingen komen Meta niet ten goede, zoals de rechter die de zaak leidt, rechter Thomas Hixson, opmerkte in een bevel op woensdag waarin Meta’s verzoek om grote delen van de indiening te redigeren werd afgewezen.

    “Het is duidelijk dat het verzoek van Meta om geheimhouding niet is ontworpen om te beschermen tegen de bekendmaking van gevoelige bedrijfsinformatie die concurrenten in hun voordeel zouden kunnen gebruiken,” schreef Hixson. “In plaats daarvan is het ontworpen om negatieve publiciteit te vermijden.”

    We hebben Meta benaderd voor commentaar en zullen dit stuk bijwerken als we iets terughoren.

    Share.
    Leave A Reply