Cadastre-se e receba grátis as principais notícias do Correio.
Carol Neves
Publicado em 7 de fevereiro de 2025 às 09:27
Um caso de direitos autorais movido por escritores contra a Meta acusa a empresa de treinar seus modelos de Inteligência Artificial usando obras pirateadas. E-mails divulgados recentemente trariam "provas mais contundentes" da prática, de acordo com reportagem do site especializado em tecnologia Ars Technica. >
Os documentos mostram que a Meta baixou e compartilhou ilegalmente dezenas de terabytes de dados de bibliotecas clandestinas, como Z-Library e LibGen, para treinar seus sistemas de inteligência artificial. Segundo os autores, a Meta teria baixado "pelo menos 81,7 terabytes de dados de várias bibliotecas sombrias por meio do site Anna’s Archive, incluindo pelo menos 35,7 terabytes de dados da Z-Library e LibGen". Além disso, a empresa já teria baixado "80,6 terabytes de dados da LibGen".>
"A magnitude do esquema ilegal de torrent da Meta é impressionante", afirmaram os autores em documentos judiciais, destacando que "atos muito menores de pirataria de dados — apenas 0,008% do volume de obras protegidas por direitos autorais pirateadas pela Meta — já resultaram em juízes encaminhando o caso para investigação criminal". Os autores também alegam que a Meta tentou esconder suas atividades, evitando o uso de servidores do Facebook para "minimizar o risco" de rastreamento e operando em "modo sigiloso", conforme descrito em mensagens internas.>
Funcionários da Meta expressaram preocupação com as práticas. Nikolay Bashlykov, engenheiro de pesquisa da empresa, escreveu em abril de 2023: "Fazer torrents de um laptop corporativo não parece certo", acrescentando um emoji de sorriso. Ele também manifestou preocupação com o uso de endereços IP da Meta para "baixar conteúdo pirata por meio de torrents". Em setembro do mesmo ano, Bashlykov alertou a equipe jurídica sobre os riscos legais de "semear" os arquivos, ou seja, compartilhá-los externamente. No entanto, os autores alegam que a Meta ignorou esses avisos e continuou a baixar e compartilhar terabytes de dados até abril de 2024.>
Agora, os autores pedem que funcionários da Meta envolvidos na decisão de usar a LibGen sejam novamente interrogados, já que as novas evidências "contradizem depoimentos anteriores". E-mails não editados mostram que a decisão de usar a LibGen ocorreu após "uma escalada prévia para MZ" (Mark Zuckerberg), contradizendo a afirmação do CEO de que não estava envolvido. >
A Meta, que não comentou as novas alegações, defende que o uso de dados da LibGen para treinar IA é "uso justo". No entanto, a empresa pode enfrentar desafios legais adicionais, já que os autores ampliaram sua teoria de distribuição, alegando que a Meta não apenas treinou seus modelos com obras pirateadas, mas também as distribuiu ilegalmente.>