As corporações de tecnologia estão recorrendo a táticas questionáveis para forçar seus modelos de inteligência sintética famintos por dados, extraindo dados de livros, sites, fotografias e postagens de mídia social, sem a sabedoria de seus criadores.
As corporações de inteligência artificial estão mantendo segredos sobre suas fontes de conhecimento do exercício, no entanto, uma investigação da Proof News descobriu que algumas das corporações mais ricas do mundo usam cortinas de milhares de vídeos do YouTube para exercitar suas plataformas.
As corporações fizeram isso apesar dos regulamentos do YouTube proibirem a coleta de cortinas na plataforma sem permissão.
A investigação da Proof News descobriu que legendas em mais de 150. 000 vídeos do YouTube, de mais de 48. 000 canais, foram usadas em gigantes do Vale do Silício: Anthropic, NVIDIA, Apple e Salesforce são alguns exemplos daqueles que usaram indevidamente o conteúdo desses criadores do YouTube.
Proof News foi descoberto por várias estrelas na plataforma, incluindo os famosos MrBeast, Jacksepticeye e PewDiePie.
“Ninguém veio até mim e disse: ‘Gostaríamos de usar isso'”, disse David Pakman, apresentador do The David Pakman Show, um canal político com mais de 2 milhões de assinantes e mais de 2 bilhões de visualizações.
Quatro outras pessoas trabalham em tempo integral na empresa de Pakman, que publica vários vídeos por dia, além de gerar um podcast, TikTok e outros vídeos.
Pakman observou que alguns meios de comunicação assinaram recentemente acordos de pagamento para usar suas pinturas em treinamento de IA.
“É meu sustento e dedico tempo, recursos, dinheiro e o tempo da minha equipe para criar esse conteúdo”, disse Pakman. “Não falta trabalho. ”
Muitos outros criadores acham incrivelmente desrespeitoso que as empresas usem seus trabalhos sem seu consentimento, especialmente porque os estúdios eventualmente poderão usar IA generativa para atualizar o maior número possível de artistas.
Além disso, esses bancos de dados do YouTube são o primeiro conjunto de dados educacionais de IA a revolucionar as indústrias artísticas.
O colaborador do Proof News, Alex Reisner, recebeu uma cópia do Books3, um conjunto de dados recebido e usado por empresas, e publicou um artigo no The Atlantic no ano passado relatando uma descoberta embaraçosa.
O jornalista descobriu que mais de 180 mil livros, incluindo os escritos por Margaret Atwood, Michael Pollan e Zadie Smith, foram utilizados indevidamente por empresas que procuravam dados sobre educação.
Desde então, muitos autores processaram empresas de IA pelo uso não autorizado de suas obras, bem como por supostas violações de direitos autorais.
Recentemente, muitos casos aumentaram e a plataforma que hospeda o Books3 removeu o banco de dados de ativos.
Em reação a esses processos, réus como Meta, OpenAI e Bloomberg argumentaram que suas ações constituíam uso.
Os editores do 4gnews recomendam: