Zuckerberg osobiście zatwierdził kradzież, twierdzi pięć wydawnictw pozywających Meta
Liczba, przy której warto się zatrzymać, to 267 terabajtów. To ilość pirackiego materiału — książek, czasopism akademickich, rękopisów — który pięć dużych wydawnictw twierdzi, że Meta pobrała i wykorzystała do trenowania swoich systemów sztucznej inteligencji, za wyraźną zgodą samego Marka Zuckerberga. Dla porównania: 267 terabajtów przekracza wielokrotnie cały drukowany zbiór Biblioteki Kongresu USA.
Hachette, Macmillan, McGraw Hill, Elsevier i Cengage złożyły pozew 5 maja, stając się pierwszymi wydawnictwami, które skoordynowały działania prawne przeciwko firmie zajmującej się sztuczną inteligencją w związku z budowaniem dużych modeli językowych. Pisarz Scott Turow figuruje jako współpowód. Centralne twierdzenie jest precyzyjne i dość obciążające: Meta przez chwilę rozważała zapłacenie za treści, które chciała, obliczyła, że licencjonowanie jest zbyt kosztowne, przekazała kwestię bezpośrednio do Zuckerberga w kwietniu 2023 roku i otrzymała ustne polecenie zaprzestania negocjacji licencyjnych. Następnie, według pozwu, rozpoczęło się masowe pobieranie pirackiego materiału: 267 terabajtów odpowiadających setkom milionów publikacji.
Odpowiedź Mety: trenowanie AI na materiałach chronionych prawem autorskim kwalifikuje się jako "fair use". To standardowe stanowisko branży technologicznej — intelektualny odpowiednik nastolatka, który twierdzi, że odpisywanie cudzych zadań domowych jest formą wspólnego uczenia się. Sądy nie rozstrzygnęły ostatecznie tej kwestii; sprawy wciąż się mnożą.
To, co wyróżnia ten pozew, to bezpośredniość argumentu dotyczącego osobistej odpowiedzialności. Większość pozwów przeciwko firmom technologicznym celuje w korporację i pozwala kadrom kierowniczym schować się za nią. Ten wymienia Zuckerberga z imienia i nazwiska i twierdzi, że nie tylko nie zapobiegł naruszeniu, ale je aktywnie zachęcał — że pytanie zostało mu zadane, odpowiedział na nie, a odpowiedź brzmiała: działajcie. Jeśli to twierdzenie przeżyje do fazy discovery, zapowiadałoby wyjątkowo niekomfortowe zeznania.
Cień, który unosi się nad tym wszystkim, to ugoda Anthropic w wysokości 1,5 miliarda dolarów w sprawie praw autorskich z września ubiegłego roku — największa w historii prawa amerykańskiego — z grupą powodów-autorów. Wydawnictwa stojące za tym nowym pozwem znają precedens i arytmetykę. Anthropic zapłaciło około 2900 dolarów za dzieło. Meta miała użyć ich o wiele więcej.
Jest jeden szczegół w pozwie, który nieustannie do mnie wraca. Meta rozważała licencjonowanie. Rozważała je w porównaniu z alternatywą. Wybrała inaczej. To nie jest historia firmy, która nie wiedziała, że robi coś prawnie wątpliwego — to historia firmy, która rozumiała to doskonale i mimo wszystko zdecydowała się kontynuować, prawdopodobnie kalkulując, że koszt ewentualnego procesu byłby niższy niż koszt legalnego dostępu.
Ten proces nie rozwiąże natychmiast problemu znikania dzieł autorów w zbiorach danych treningowych i wyłaniania się, przeobrażonych, z systemów AI. Ale zrobił coś pożytecznego: postawił argument, że osoba na szczycie łańcucha decyzyjnego nie jest izolowana od tego, co dzieje się na dole. To, co zdecydują sądy, powie nam wiele o tym, na jakim internecie upłynie następna dekada.