A NVIDIA supostamente forneceu um design de IA generativa com 80 anos de vídeo gravado por dia, de acordo com descobertas da página online 404 Media. Para fazer isso, os funcionários da empresa removeram massivamente arquivos de plataformas como YouTube e Netflix, mesmo diante de possíveis preocupações com violação de direitos autorais.
Dados recebidos de vazamentos de conhecimento interno do Slack (uma plataforma de comunicação empresarial), e-mails corporativos e depoimentos de ex-funcionários. Todos os dados seriam usados para exercitar um gênero de IA que ainda não foi publicado, como parte de um projeto chamado Cosmos.
Os funcionários supostamente usaram uma ferramenta de código aberto para baixar vídeos do YouTube e fazer upload de dados em massa com 20 a 30 máquinas virtuais hospedadas na Amazon Web Services. O resultado foi a extração de 80 anos de vídeos por dia, além do acúmulo de 30 milhões. URLs em menos de um mês.
Algumas das bases de conhecimento em vídeo usadas na tarefa deixam claro que elas estão disponíveis apenas para fins educacionais e não são licenciadas para publicidade. Embora a empresa tenha seus próprios pesquisadores, há mensagens de que o conteúdo seria seguido com motivações publicitárias. na estrutura da nova versão. O vice-presidente de pesquisa da NVIDIA, Ming-Yu Liu, um dos profissionais mais ativos em pesquisa de dados.
Um porta-voz da NVIDIA, contatado para o relatório original, disse que a empresa “respeita os direitos de todos os criadores de conteúdo e acredita que os modelos e nossos esforços são totalmente consistentes com a letra e o espírito da lei de direitos autorais”.
La empresa también justifica el “uso justo” de los vídeos, diciendo que permiten que las pinturas se utilicen con fines transformadores, como modelos educativos, y afirma que “todos tienen libertad para conocer los hechos, las ideas, los datos y la información de a fonte”. e use-os para criar suas próprias expressões.
A reportagem original entrou em contato com o YouTube e a Netflix para saber sua posição sobre o assunto. A empresa ligada ao Google reforçou os comentários feitos pelo CEO Neal Mohan em abril deste ano, quando questionado sobre os vídeos da plataforma para o treinamento Sora da OpenAI. Na época, Mohan disse que isso seria uma “violação flagrante dos termos de serviço do YouTube”. vestir.
Um porta-voz da Netflix respondeu que a empresa de streaming não tinha um acordo com a Nvidia para mover conteúdo e que os termos de serviço não permitiam a mineração de dados em massa.
Mais uma vez, a reclamação questiona a transparência das grandes corporações de tecnologia nos modelos educacionais de IA, especificamente quando se trata de materiais protegidos por direitos autorais. Vale lembrar que a Nvidia e outras empresas de tecnologia primária, como Apple e Salesforce, foram acusadas no passado de vídeos do YouTube sobre educação em IA.
Fonte: 404 Mídia