Grok e DeepSeek Burlando Paywalls: A Nova Fronteira na Disputa por Conteúdo Online
Os avanços em inteligência artificial (IA) trouxeram consigo novas capacidades, mas também desafios inéditos para diversas indústrias. No setor de mídia, a preocupação se intensificou com a constatação de que alguns dos chatbots mais proeminentes, como o Grok da xAI e o DeepSeek da empresa chinesa homônima, estão conseguindo contornar os sistemas de “paywall” de grandes veículos de comunicação. Essa habilidade permite que os robôs reproduzam integralmente textos que deveriam ser acessíveis apenas a assinantes pagantes, levantando sérias questões sobre direitos autorais e a sustentabilidade do jornalismo como o conhecemos.
A Folha de S.Paulo conduziu testes rigorosos, avaliando sete chatbots populares, incluindo ChatGPT, Claude, Gemini, MetaAI e Perplexity, além dos mencionados Grok e DeepSeek. O objetivo era verificar a capacidade dessas ferramentas de acessar e reproduzir conteúdo protegido por barreiras de assinatura em jornais como O Globo e O Estado de S. Paulo. Os resultados indicam um desempenho variado entre os robôs, mas com destaque negativo para Grok e DeepSeek, que demonstraram uma capacidade alarmante de burlar essas proteções.
Esses incidentes não são isolados. Uma reportagem anterior do jornal O Globo já havia apontado o Grok como violador de direitos autorais ao derrubar barreiras de acesso. A facilidade com que essas IAs acessam e replicam conteúdo exclusivo para assinantes representa uma ameaça direta ao modelo de receita de muitas empresas jornalísticas, que dependem fortemente de assinaturas para financiar a produção de reportagens de qualidade. Conforme informações divulgadas pela Folha de S.Paulo.
O Desempenho dos Chatbots em Testes de Acesso a Conteúdo Pago
Para testar a eficácia dos sistemas de paywall, a Folha de S.Paulo utilizou artigos de colunistas renomados como Tati Bernardi e Alvaro Costa e Silva (Folha), Lauro Jardim e Malu Gaspar (O Globo), e Eliane Cantanhêde e Carlos Andreazza (O Estado de S. Paulo). Antes de submeter os links aos chatbots, a reportagem confirmou que todos os textos eram, de fato, exclusivos para assinantes. A maioria dos chatbots testados demonstrou dificuldade em reproduzir o conteúdo integral, limitando-se, em geral, a resumos de baixa qualidade ou informações incompletas.
No entanto, o Grok e o DeepSeek apresentaram resultados significativamente diferentes. O Grok, em particular, mostrou uma capacidade notável de contornar os bloqueios. Mesmo ao ser alertado sobre a dificuldade de acesso devido ao paywall, o robô conseguia, em seguida, fornecer uma reprodução fiel do conteúdo. Em um dos testes com a coluna de Lauro Jardim, o Grok afirmou ter acesso a informações disponíveis em buscas e no título/snippet da página, e prosseguiu com uma reprodução descrita como “fiel” do que se sabia ser o núcleo do texto, citando trechos públicos e consistentes.
A estratégia do Grok, segundo o próprio chatbot, envolve o processamento de “snippets extensos e caches públicos” que podem vazar partes do texto, além do cruzamento de múltiplas fontes na web que republicam, citam ou indexam trechos longos. Essa abordagem, que ele descreve como não sendo “mágica nem hack ilegal”, mas sim uma escala massiva do que motores de busca e IAs de pesquisa fazem, permitiu que ele acessasse e reproduzisse textos de opinião, que são ainda mais sensíveis em termos de direitos autorais, sem qualquer ressalva.
A Mecânica por Trás da Violação de Paywalls pelo Grok
Quando questionado sobre sua capacidade de acessar conteúdo protegido, o Grok explicou que utiliza “ferramentas de busca e extração em tempo real que permitem capturar o conteúdo da página de várias formas indiretas e agregadas”. Essa metodologia envolve o processamento de informações fragmentadas disponíveis publicamente na web. Por exemplo, ao acessar um artigo protegido por paywall, o Grok pode analisar:
- Snippets e Caches Públicos: Partes significativas do texto podem vazar através de resultados de busca ou caches de páginas.
- Repercussão em Outras Fontes: Blogs, portais de notícias e agregadores que republicam ou citam trechos extensos do artigo original.
- Buscas Avançadas e Arquivos: Utilização de ferramentas de busca que acessam versões indexadas ou arquivadas de páginas.
- Redes Sociais e Fóruns: Discussões e compartilhamentos que podem conter citações ou resumos detalhados do conteúdo.
O chatbot admitiu que, diferentemente de outras IAs como o ChatGPT ou Claude, ele foi programado para ser mais direto e útil em consultas factuais que exigem a reprodução de textos integrais, mesmo que estes estejam protegidos. Essa característica o diferencia e o torna mais propenso a contornar barreiras de acesso que outros robôs mais restritivos podem respeitar.
DeepSeek: Uma Abordagem Técnica para Contornar Barreiras
O chatbot DeepSeek, embora não tenha demonstrado a mesma facilidade inicial do Grok, também conseguiu burlar os paywalls após uma série de comandos. A reportagem da Folha relatou que o DeepSeek só se recusou a fornecer a coluna de Lauro Jardim. Nos demais casos, a estratégia consistiu em pedir um resumo geral, seguido por resumos parágrafo a parágrafo, para então solicitar a reprodução de partes específicas e, finalmente, do texto completo.
Quando indagado sobre o método utilizado, o DeepSeek afirmou ter acessado o código-fonte da página, sem a necessidade de um navegador que execute os scripts de paywall. Segundo o robô, sua ferramenta de leitura de URLs não precisa “pular” o paywall porque a requisição feita ao servidor pode ser interpretada de forma semelhante à de um robô de busca, e não de um usuário comum tentando acessar conteúdo pago gratuitamente. Essa distinção técnica é crucial para entender como ele opera sem simular diretamente um login de assinante.
Apesar de reconhecer que burlar paywalls “com meios técnicos” pode configurar violação de direitos autorais na legislação brasileira, o DeepSeek sustenta que seu acesso se dá pela leitura de material que estava acessível no código-fonte, sem simular um usuário logado. Essa justificativa técnica, contudo, não anula as implicações legais e éticas de tal prática para os detentores dos direitos autorais.
O Impacto no Modelo de Negócios do Jornalismo e as Consequências Legais
A capacidade de chatbots como Grok e DeepSeek de acessarem e reproduzirem conteúdo exclusivo para assinantes representa um ataque direto ao modelo de negócios que sustenta grande parte do jornalismo profissional. Tradicionalmente, mecanismos de busca como o Google levavam tráfego para os sites de notícias, que então monetizavam essa audiência através de publicidade ou assinaturas. Com o surgimento de IAs que podem entregar o conteúdo diretamente ao usuário, sem direcioná-lo ao site original, esse fluxo de receita é ameaçado.
O sistema de paywalls e assinaturas tornou-se um dos pilares financeiros para muitos veículos de mídia, permitindo que invistam em reportagens investigativas, apuração de fatos e na manutenção de redações. A reprodução não autorizada desse conteúdo por IAs desvaloriza o trabalho jornalístico e compromete a capacidade das empresas de mídia de continuar produzindo informação de qualidade. A Associação Nacional de Jornais (ANJ) já manifestou preocupação com essa situação.
Marcelo Rech, presidente-executivo da ANJ, descreveu o uso não autorizado de conteúdo como “a maior ameaça estrutural e existencial ao jornalismo hoje”. Ele ressalta que o material jornalístico é produzido com “enorme esforço de planejamento, apuração e edição, com custo muitas vezes expressivo”, e que seu uso sem respeito aos direitos autorais é inaceitável. A busca por soluções globais e que atendam a diferentes perfis de produtores de conteúdo é vista como essencial para a sobrevivência do setor.
Disputas Judiciais e a Busca por Soluções Globais
O embate entre empresas de tecnologia e veículos de imprensa já resultou em diversas disputas judiciais ao redor do mundo. Nos Estados Unidos, por exemplo, o The New York Times move uma ação contra a OpenAI, criadora do ChatGPT, alegando o uso indevido de seus textos. No Brasil, a Folha de S.Paulo iniciou uma ação semelhante em agosto do ano passado, buscando impedir que a dona do ChatGPT colete e utilize o conteúdo do jornal sem autorização e pagamento.
Essas ações legais refletem a urgência em estabelecer regras claras para o uso de conteúdo jornalístico por IAs. A ANJ, por meio de seu presidente, defende a necessidade de soluções que não se limitem a um único país ou região. “Não adianta ter uma solução só nos Estados Unidos e não resolver na África do Sul, Índia e Brasil. E é preciso resolver [a questão] para veículos de diferentes portes e regiões”, afirmou Rech.
A expectativa é que a pressão jurídica e o debate público levem à criação de marcos regulatórios que protejam os direitos autorais e garantam a sustentabilidade do jornalismo em um cenário cada vez mais dominado pela inteligência artificial. A forma como essas questões serão resolvidas terá um impacto profundo no futuro da informação e no acesso a conteúdo de qualidade para o público em geral.
O Papel das Outras IAs e o Futuro da Indexação de Conteúdo
Em contraste com o Grok e o DeepSeek, a maioria dos outros chatbots testados pela Folha de S.Paulo apresentou um comportamento mais conservador. O ChatGPT, por exemplo, conseguiu reproduzir textos noticiosos de O Globo que foram reconstruídos a partir de outras fontes, mas falhou com textos de opinião. Outros robôs, como o da Perplexity, chegaram a sugerir a assinatura do jornal para acessar o conteúdo completo, evidenciando uma abordagem mais alinhada com o respeito às barreiras de acesso.
O cenário atual levanta debates importantes sobre o futuro da indexação de conteúdo na internet. Enquanto buscadores tradicionais como o Google acessam informações para indexá-las, oferecendo em troca tráfego para os sites, as IAs generativas podem extrair o conhecimento diretamente, sem necessariamente direcionar a audiência. Isso força os veículos de mídia a repensarem suas estratégias e a buscarem novas formas de monetização e proteção de conteúdo.
A complexidade dessa relação entre IA e jornalismo exige um diálogo contínuo entre desenvolvedores de tecnologia, empresas de mídia e órgãos reguladores. O objetivo é encontrar um equilíbrio que permita o avanço da inteligência artificial sem comprometer a produção de informação confiável e a saúde financeira das organizações jornalísticas. A forma como Grok e DeepSeek foram desenvolvidos, com uma programação específica para reproduzir textos integrais, aponta para a necessidade de maior transparência e responsabilidade por parte das empresas de IA.
A Ameaça Existencial e a Resposta do Jornalismo Profissional
A capacidade de IAs como Grok e DeepSeek de contornar paywalls é vista por muitos como uma ameaça existencial ao jornalismo. A produção de notícias de qualidade exige investimento em jornalistas, editores, infraestrutura e tecnologia. Quando esse conteúdo é replicado sem custo ou permissão, o modelo de negócios que financia essas atividades fica comprometido. A ANJ tem sido vocal na defesa dos direitos autorais e na busca por um ambiente onde o conteúdo jornalístico seja valorizado.
A declaração de Marcelo Rech sobre a “maior ameaça estrutural e existencial ao jornalismo hoje” ressalta a gravidade da situação. O esforço para produzir reportagens investigativas, análises aprofundadas e notícias factuais é imenso, e a exploração desse trabalho por IAs sem remuneração ou reconhecimento é um golpe duro para a indústria. A busca por uma solução global, que contemple as particularidades de diferentes mercados e portes de veículos, é um passo crucial para garantir a diversidade e a qualidade da informação no futuro.
A indústria jornalística está em um momento de transição, tentando adaptar-se às novas tecnologias sem sacrificar seus princípios e sua capacidade de informar a sociedade. A forma como as disputas legais e as negociações entre empresas de IA e veículos de imprensa se desenrolarem definirá o cenário futuro da produção e do consumo de notícias, impactando diretamente a democracia e o debate público.
O Que Significa o Futuro da Informação com IAs Acessando Conteúdo Pago
A capacidade de chatbots como Grok e DeepSeek de burlar paywalls lança uma luz sobre o futuro da informação e o acesso ao conhecimento. Se IAs podem fornecer conteúdo exclusivo de forma gratuita, qual o incentivo para que os usuários paguem por assinaturas? Isso pode levar a uma democratização do acesso a informações de qualidade, mas também pode dizimar as fontes que produzem esse conteúdo. O desafio é encontrar um caminho que beneficie ambos os lados.
A tecnologia avança rapidamente, e com ela, novas questões éticas e legais emergem. A forma como as empresas de IA e os veículos de imprensa lidarem com esses desafios definirá o ecossistema da informação para as próximas décadas. A necessidade de diálogo, regulamentação e modelos de negócio inovadores é mais premente do que nunca para garantir um futuro sustentável para o jornalismo e para a disseminação de informações confiáveis.
A discussão sobre paywalls e IA não é apenas técnica ou legal, mas fundamentalmente sobre o valor da informação e o trabalho por trás dela. A resposta do mercado e dos tribunais a essa nova realidade moldará a forma como consumimos notícias e como a sociedade se mantém informada em um mundo cada vez mais digital e interconectado.