EM ANDAMENTO

Meta baixou mais de 81 TB de livros piratas para treinar IA, dizem autores em processo

Empresa não comentou novas alegações, mas defende que o uso de dados para treinar IA é "justo"

Carol Neves

Publicado em 7 de fevereiro de 2025 às 09:27

Livro pirata Crédito: Shutterstock

Um caso de direitos autorais movido por escritores contra a Meta acusa a empresa de treinar seus modelos de Inteligência Artificial usando obras pirateadas. E-mails divulgados recentemente trariam "provas mais contundentes" da prática, de acordo com reportagem do site especializado em tecnologia Ars Technica.

Os documentos mostram que a Meta baixou e compartilhou ilegalmente dezenas de terabytes de dados de bibliotecas clandestinas, como Z-Library e LibGen, para treinar seus sistemas de inteligência artificial. Segundo os autores, a Meta teria baixado "pelo menos 81,7 terabytes de dados de várias bibliotecas sombrias por meio do site Anna’s Archive, incluindo pelo menos 35,7 terabytes de dados da Z-Library e LibGen". Além disso, a empresa já teria baixado "80,6 terabytes de dados da LibGen".

"A magnitude do esquema ilegal de torrent da Meta é impressionante", afirmaram os autores em documentos judiciais, destacando que "atos muito menores de pirataria de dados — apenas 0,008% do volume de obras protegidas por direitos autorais pirateadas pela Meta — já resultaram em juízes encaminhando o caso para investigação criminal". Os autores também alegam que a Meta tentou esconder suas atividades, evitando o uso de servidores do Facebook para "minimizar o risco" de rastreamento e operando em "modo sigiloso", conforme descrito em mensagens internas.

Funcionários da Meta expressaram preocupação com as práticas. Nikolay Bashlykov, engenheiro de pesquisa da empresa, escreveu em abril de 2023: "Fazer torrents de um laptop corporativo não parece certo", acrescentando um emoji de sorriso. Ele também manifestou preocupação com o uso de endereços IP da Meta para "baixar conteúdo pirata por meio de torrents". Em setembro do mesmo ano, Bashlykov alertou a equipe jurídica sobre os riscos legais de "semear" os arquivos, ou seja, compartilhá-los externamente. No entanto, os autores alegam que a Meta ignorou esses avisos e continuou a baixar e compartilhar terabytes de dados até abril de 2024.

Agora, os autores pedem que funcionários da Meta envolvidos na decisão de usar a LibGen sejam novamente interrogados, já que as novas evidências "contradizem depoimentos anteriores". E-mails não editados mostram que a decisão de usar a LibGen ocorreu após "uma escalada prévia para MZ" (Mark Zuckerberg), contradizendo a afirmação do CEO de que não estava envolvido.

A Meta, que não comentou as novas alegações, defende que o uso de dados da LibGen para treinar IA é "uso justo". No entanto, a empresa pode enfrentar desafios legais adicionais, já que os autores ampliaram sua teoria de distribuição, alegando que a Meta não apenas treinou seus modelos com obras pirateadas, mas também as distribuiu ilegalmente.

Meta baixou mais de 81 TB de livros piratas para treinar IA, dizem autores em processo

Empresa não comentou novas alegações, mas defende que o uso de dados para treinar IA é "justo"

Mais recentes

Trump descarta recessão nos EUA e sinaliza flexibilização de tarifas sobre o Canadá

Brasileira morre após queda de 40 metros em prédio na Colômbia; namorado é suspeito

Papa Francisco tem melhora e não corre mais perigo iminente

MAIS LIDAS

Jogador do Jacuipense pede desculpas após dizer que ia "matar o Bahia"

André Marques revela motivo que o faz desistir do sexo: 'Estou fora'

Jovem é reconhecido como filho de Mussum, mas não terá direito a herança; entenda

Saiba quanto ganham os jurados do Carnaval do Rio