AI trapaceira: como a Perplexity driblou bloqueios para fazer scraping de sites


0
SAN FRANCISCO, CALIFORNIA - OCTOBER 30: Aravind Srinivas, Co-Founder & CEO of Perplexity, speaks onstage during TechCrunch Disrupt 2024 Day 3 at Moscone Center on October 30, 2024 in San Francisco, California. (Photo by Kimberly White/Getty Images for TechCrunch)

Nos últimos anos, a inteligência artificial (IA) tem se mostrado uma ferramenta poderosa para diversas áreas, desde a saúde até o marketing. No entanto, como toda tecnologia, ela também pode ser usada de forma indevida e até mesmo antiética. É o caso da Perplexity, uma empresa acusada de realizar scraping de sites que explicitamente bloqueavam esse tipo de coleta de dados.

O termo “scraping” se refere à prática de coletar informações de sites na internet de forma automatizada, utilizando robôs e algoritmos para varrer a web em busca de dados específicos. Essa prática pode ser utilizada de forma legítima, por exemplo, para reunir informações de diferentes fontes e analisá-las em conjunto. No entanto, quando é realizada sem o consentimento do site em questão, pode ser considerada uma violação de privacidade e até mesmo um crime.

Foi o que aconteceu com a Perplexity. A empresa, que se apresenta como especializada em soluções de IA para empresas, foi acusada de realizar scraping em sites que explicitamente bloqueavam esse tipo de coleta de dados. Isso significa que os proprietários desses sites já haviam tomado medidas para impedir que suas informações fossem extraídas de forma automatizada, mas a Perplexity encontrou uma maneira de contornar essas barreiras.

De acordo com a TechCrunch, a Perplexity utilizava uma técnica chamada “headless browsing”, que consiste em simular a navegação humana em um site utilizando um navegador automatizado, sem a exibição da interface gráfica. Isso faz com que o site não reconheça que está sendo visitado por um robô e, portanto, não bloqueie a coleta de dados. Além disso, a empresa também utilizava endereços IP de diferentes países para evitar ser detectada pelos bloqueios geográficos.

Essa prática é extremamente preocupante, pois demonstra que a Perplexity estava disposta a driblar os bloqueios impostos pelos próprios sites para obter informações. Isso pode ser considerado uma violação de privacidade e até mesmo uma ação antiética, já que os proprietários dos sites bloquearam a coleta de dados por algum motivo e a Perplexity ignorou essas medidas.

A empresa alega que a coleta de dados é feita apenas para fins de pesquisa e que não comercializa essas informações. No entanto, como aponta a TechCrunch, a Perplexity possui clientes de áreas como o marketing e o setor financeiro, o que levanta dúvidas sobre o uso que está sendo feito desses dados.

Além disso, a própria tecnologia utilizada pela Perplexity é alvo de críticas. O headless browsing pode ser utilizado de forma legítima, mas também é uma técnica amplamente utilizada por hackers e criminosos virtuais para realizar ataques e fraudes. Dessa forma, a empresa está colocando em risco a segurança dos usuários e dos próprios sites que está coletando dados.

A situação levanta questões importantes sobre a regulamentação do uso de IA e scraping na internet. Atualmente, não existem leis específicas que regulamentem essas práticas, o que pode abrir espaço para o uso indevido dessas tecnologias. No entanto, é preciso que as autoridades e órgãos reguladores fiquem atentos a essas questões e tomem medidas para garantir que a privacidade e a segurança dos usuários sejam preservadas.

Além disso, as empresas que utilizam IA e scraping em suas atividades também devem adotar medidas éticas e responsáveis para garantir que essas tecnologias sejam usadas de forma adequada. Isso inclui respeitar bloqueios impostos por sites e obter consentimento dos usuários antes de coletar seus dados.

É importante ressaltar que a IA e o scraping têm um grande potencial para trazer benefícios para a sociedade, desde a criação de novas soluções até a geração de insights valiosos. No entanto, é necessário que essas tecnologias sejam utilizadas de forma responsável e ética, respeitando a privacidade e a segurança dos usuários e seguindo as leis e regulamentações vigentes.

Em um mundo cada vez mais conectado e com a crescente utilização de tecnologias como a inteligência artificial, é fundamental que sejam tomadas medidas para garantir que essas ferramentas sejam usadas para o bem e não para violar a privacidade e a segurança dos usuários. A situação envolvendo a Perplexity é um alerta para a importância de regulamentações e práticas éticas no uso de IA e scraping na internet. Afinal, como diz o ditado, “com grandes poderes vêm grandes responsabilidades”.

Referência:
Clique aqui


Like it? Share with your friends!

0