Zuckerberg autorizou pessoalmente o furto, dizem cinco editoras que processam a Meta
O número que merece atenção é 267 terabytes. Essa é a quantidade de material pirateado — livros, periódicos, manuscritos — que cinco grandes editoras alegam que a Meta baixou e usou para treinar seus sistemas de inteligência artificial, com a aprovação explícita do próprio Mark Zuckerberg. Para referência: 267 terabytes supera em muito a coleção impressa completa da Biblioteca do Congresso dos Estados Unidos.
Hachette, Macmillan, McGraw Hill, Elsevier e Cengage apresentaram sua ação em 5 de maio, tornando-se as primeiras editoras a se unir em ação coordenada contra uma empresa de IA pelo treinamento de grandes modelos de linguagem. O escritor Scott Turow aparece como co-demandante. A alegação central é precisa e bastante reveladora: a Meta considerou brevemente pagar pelo conteúdo que desejava, calculou que o licenciamento era caro, escalou a questão pessoalmente para Zuckerberg em abril de 2023 e recebeu instruções verbais para abandonar as negociações de licenças. Em seguida, a demanda alega, começou o download massivo: 267 terabytes equivalentes a centenas de milhões de publicações.
A resposta da Meta: treinar IA com material protegido por direitos autorais constitui "uso justo". Esta é a posição padrão da indústria tecnológica — o equivalente intelectual de um adolescente que afirma que copiar a lição de casa de outra pessoa é uma forma de aprendizado colaborativo. Os tribunais não resolveram definitivamente a questão; os casos continuam se multiplicando.
O que distingue esta ação é a diretez de seu argumento sobre responsabilidade pessoal. A maioria dos processos contra empresas de tecnologia mira na corporação e deixa o executivo protegido atrás dela. Este nomeia Zuckerberg explicitamente e alega que ele não apenas deixou de evitar a infração, mas a incentivou ativamente — que a questão foi apresentada a ele, que ele respondeu, e que a resposta foi: prossiga. Se essa alegação sobreviver até a fase de descoberta de provas, promete um depoimento extraordinariamente desconfortável.
A sombra que paira sobre tudo isso é o acordo de US$ 1,5 bilhão que a Anthropic fechou em setembro passado — o maior da história legal americana — com um grupo de autores demandantes. As editoras por trás desta nova ação conhecem o precedente e a aritmética. A Anthropic pagou aproximadamente US$ 2.900 por obra. A Meta teria usado muito mais.
Há um detalhe na ação que continua me perturbando. A Meta considerou o licenciamento. Pesou contra a alternativa. Escolheu de forma diferente. Não é a história de uma empresa que não sabia que estava fazendo algo juridicamente questionável — é a história de uma empresa que entendia perfeitamente bem e decidiu prosseguir de qualquer forma, provavelmente calculando que o custo da eventual ação judicial seria menor que o do acesso legítimo.
Este processo não resolverá imediatamente o problema das obras dos autores desaparecendo em conjuntos de dados de treinamento e emergindo transformadas de sistemas de IA. Mas fez algo útil: colocou o argumento de que a pessoa no topo da cadeia de tomada de decisões não está isolada do que acontece na base. O que os tribunais decidirem nos dirá muito sobre que tipo de internet viveremos na próxima década.