Acesse sua conta
Ainda não é assinante?
Ao continuar, você concorda com a nossa Política de Privacidade
ou
Entre com o Google
Alterar senha
Preencha os campos abaixo, e clique em "Confirma alteração" para confirmar a mudança.
Recuperar senha
Preencha o campo abaixo com seu email.

Já tem uma conta? Entre
Alterar senha
Preencha os campos abaixo, e clique em "Confirma alteração" para confirmar a mudança.
Dados não encontrados!
Você ainda não é nosso assinante!
Mas é facil resolver isso, clique abaixo e veja como fazer parte da comunidade Correio *
ASSINE

Meta baixou mais de 81 TB de livros piratas para treinar IA, dizem autores em processo

Empresa não comentou novas alegações, mas defende que o uso de dados para treinar IA é "justo"

  • Foto do(a) author(a) Carol Neves
  • Carol Neves

Publicado em 7 de fevereiro de 2025 às 09:27

Livro pirata
Livro pirata Crédito: Shutterstock

Um caso de direitos autorais movido por escritores contra a Meta acusa a empresa de treinar seus modelos de Inteligência Artificial usando obras pirateadas. E-mails divulgados recentemente trariam "provas mais contundentes" da prática, de acordo com reportagem do site especializado em tecnologia Ars Technica. 

Os documentos mostram que a Meta baixou e compartilhou ilegalmente dezenas de terabytes de dados de bibliotecas clandestinas, como Z-Library e LibGen, para treinar seus sistemas de inteligência artificial. Segundo os autores, a Meta teria baixado "pelo menos 81,7 terabytes de dados de várias bibliotecas sombrias por meio do site Anna’s Archive, incluindo pelo menos 35,7 terabytes de dados da Z-Library e LibGen". Além disso, a empresa já teria baixado "80,6 terabytes de dados da LibGen".

"A magnitude do esquema ilegal de torrent da Meta é impressionante", afirmaram os autores em documentos judiciais, destacando que "atos muito menores de pirataria de dados — apenas 0,008% do volume de obras protegidas por direitos autorais pirateadas pela Meta — já resultaram em juízes encaminhando o caso para investigação criminal". Os autores também alegam que a Meta tentou esconder suas atividades, evitando o uso de servidores do Facebook para "minimizar o risco" de rastreamento e operando em "modo sigiloso", conforme descrito em mensagens internas.

Funcionários da Meta expressaram preocupação com as práticas. Nikolay Bashlykov, engenheiro de pesquisa da empresa, escreveu em abril de 2023: "Fazer torrents de um laptop corporativo não parece certo", acrescentando um emoji de sorriso. Ele também manifestou preocupação com o uso de endereços IP da Meta para "baixar conteúdo pirata por meio de torrents". Em setembro do mesmo ano, Bashlykov alertou a equipe jurídica sobre os riscos legais de "semear" os arquivos, ou seja, compartilhá-los externamente. No entanto, os autores alegam que a Meta ignorou esses avisos e continuou a baixar e compartilhar terabytes de dados até abril de 2024.

Agora, os autores pedem que funcionários da Meta envolvidos na decisão de usar a LibGen sejam novamente interrogados, já que as novas evidências "contradizem depoimentos anteriores". E-mails não editados mostram que a decisão de usar a LibGen ocorreu após "uma escalada prévia para MZ" (Mark Zuckerberg), contradizendo a afirmação do CEO de que não estava envolvido.

A Meta, que não comentou as novas alegações, defende que o uso de dados da LibGen para treinar IA é "uso justo". No entanto, a empresa pode enfrentar desafios legais adicionais, já que os autores ampliaram sua teoria de distribuição, alegando que a Meta não apenas treinou seus modelos com obras pirateadas, mas também as distribuiu ilegalmente.