Cloudflare bloqueará robôs que extraem conteúdo para exercitar IA

A empresa de serviços de Internet Cloudflare introduziu uma ferramenta para bloquear bots que coletam texto e imagens de sites. Esses computadores são usados para executar modelos de inteligência artificial. Nas últimas semanas, as empresas de notícias acusaram as startups de IA de não cumprirem o arquivo robots. txt. Um log que contém comandos que salvam o acesso a crawlers e scrapers.

A ferramenta é solta e bloqueia automaticamente os bots de IA analisando o tráfego da página online. A Cloudflare afirma que esse tipo de ação deixa “impressões digitais”. Graças a eles, é imaginável identificar e bloquear bots, mesmo que tentem simular o hábito de um visitante humano.

“Os consumidores não querem que os bots de IA parem em seus sites, especialmente aqueles que agem de forma desonesta”, diz a empresa. “Suspeitamos que algumas empresas de IA estejam tentando contornar os regulamentos de conteúdo e tentarão se adaptar para evitar a detecção de bots. “

Atualmente, uma das funções para bloquear scrapers e bots é colocar comandos em um arquivo robots. txt. Porém, essa abordagem apenas informa aos robôs que eles não precisam estar em vídeo, mas não os poupa da ação de tais equipamentos.

Esse desafio ficou evidente nas últimas semanas. A Forbes e a Wired acusaram a Perplexity AI de ignorar pôsteres anti-bot postados em seus sites. O chatbot da startup reproduzia reportagens exclusivas quase na íntegra, sem dar crédito.

O desafio possivelmente seria ainda maior. De acordo com a empresa de licenciamento de conteúdo TollBit, muitos agentes de IA desconhecem o padrão robots. txt. Atualmente, entre os 1. 000 mais visitados na web, 26% bloqueiam bots OpenAI.

Antes disso, o New York Times havia entrado com uma ação judicial contra a OpenAI, acusando o desenvolvedor ChatGPT de violar direitos autorais ao usar a publicação para usar modelos de IA.

Embora o veredicto ainda não tenha sido emitido, a OpenAI celebrou acordos de licenciamento de conteúdo com diversas empresas de jornalismo, incluindo Axel Springer, Vox Media e Associated Press.

No entanto, será difícil escapar do IA. La a ferramenta AI Overviews do Google, que cria respostas automáticas e as coloca nos melhores resultados de pesquisa, será bloqueada de forma independente. A única solução é bloquear absolutamente a indexação do Google, o que é problemático porque o mecanismo de pesquisa é a principal fonte de tráfego para muitos sites.

Com informações: Cloudflare, TechCrunch

Saiba mais sobre inteligência sintética

“A IA é o futuro. . . »

Por razões de condicionamento físico, não posso dizer nada mais do que digo sobre IA.

A IA tem sido usada há décadas e continuará a ser usada, agora está na moda e já está acontecendo.

Isso já teria acontecido se o mercado não estivesse em uma fase de não inovação.

Se você fala sobre aprendizado de dispositivos, esses são conceitos completamente diferentes. Se você fala sobre IA em jogos, então é qualquer coisa que esteja contida apenas neste “universo”, não é nada que seja útil ao ar livre. Na verdade, falando em jogos, F. E. A. R. Tinha uma IA absurda. E é um jogo antigo. GTA também é onde a IA brilha.

É assim que se faz, agora é estiloso e é tudo IA, mesmo que não seja

É por isso que isso é tudo o que estamos dizendo, especialmente aqui, já que a moda fica atrás dos Estados Unidos, Europa, Japão e Coreia do Sul.

É por isso que dizemos isso, especialmente aqui, enquanto a moda fica atrás dos Estados Unidos, Europa, Japão e Coreia do Sul.

Neste ponto, acho que não. Para estudos primários e aplicações sérias?Talvez.

Quando se trata de colocar jargão em qualquer coisa, o GNT sabe como fazê-lo muito rapidamente. Lembra dos dias em que havia um curso de metaverso em todos os lugares?

Mas eles também, aqueles que usam jargão, têm tudo o que é

Toda vez que vejo um artigo sobre IA, já adivinho quem é o primeiro usuário a comentar . . . hahaha (se não for o primeiro, é o 3 mais sensato) ̄_(⊙〈 ⊙)_/ ̄

Voltando ao assunto, seria divertido se a Cloudflare usasse um gerador de leitor para atualizar o conteúdo da página que a IA estava coletando ilegalmente. . . acredite como seria glorioso se outras pessoas gerassem algo mais tarde. kkkkk

Detalhe: A IA é tão antiga que já era motivo de piada nos dias do Windows 95/2k. . . um slogan do mIRC já falava sobre isso, assim como Estupidez Natural.

Voltando ao assunto, seria divertido se a Cloudflare usasse um gerador lero para atualizar o conteúdo das páginas que a IA coleta ilegalmente.

Mas é isso que a própria IA faz? XD

Não, o gerador lero lero é anti-iiiiiiiiiigo. . . como em 2000. hahaha eu costumava preencher textos e gráficos que o instrutor não lia.

Mas pense em envenenar a IA, isso desperdiçaria ciclos de sua GPU sem conteúdo útil. . . quando eles viessem ver. . . teriam que reciclar tudo e não poderiam nem reclamar. kkkkk

Até que o veredicto seja proferido, a OpenAI tem acordos de licenciamento de conteúdo com várias empresas de jornalismo, incluindo Axel Springer, Vox Media e Associated Press.

Acordos provavelmente desproporcionais, porque o jogo da OpenAI é que, se eles não se contentarem com isso, ainda aceitaremos, mas de graça. Não é nada explícito, mas todo mundo sabe disso, basta assistir ao noticiário.

A solução é bloquear completamente a indexação do Google, o que é um problema, já que o mecanismo de busca é a principal fonte de tráfego de muitos sites.

Como “todo mundo é ótimo”, eles acham que podem fazer isso sozinhos na frente dos outros, mas se aqueles que se sentem prejudicados unirem forças e até proibirem, o que restará para o Google?Na maioria das vezes, sites irrelevantes com pouca ou nenhuma confiabilidade. Se isso acontecesse, que efeito teria sobre os usuários?E no Google?

Leave a Comment Cancel Reply