CNBC
Claude Fable 5 é suspenso após decisão dos EUA e expõe os limites entre inovação em IA e regulação global

CNBCAnthropic: governo Trump remove restrições de exportação do Claude Fable 5 e do Mythos 5

Tecnologia & Inovação

Como poemas e histórias podem enganar sistemas de segurança de I.A?

Publicado 01/07/2026 • 07:30 | Atualizado há 1 hora

KEY POINTS

  • O tema voltou ao centro do debate em junho de 2026, após discussões envolvendo modelos avançados de I.A.
  • Especialistas reconhecem que eliminar completamente essas falhas é uma tarefa complexa.
  • Também há casos em que perguntas sensíveis são transformadas em histórias de ficção, diálogos ou narrativas inspiradas em contos.

Foto: Canva

Como poemas e histórias ainda podem enganar sistemas de segurança de I.A

Os mecanismos de segurança criados para impedir que sistemas de inteligência artificial (I.A) forneçam informações perigosas continuam a ser contornados por usuários que conseguem contornar as restrições por meio de pedidos aparentemente inofensivos.

O tema voltou ao centro do debate em junho de 2026, após discussões envolvendo modelos avançados de inteligência artificial e a capacidade dessas ferramentas de revelar conteúdos que deveriam permanecer bloqueados.

Empresas de tecnologia investem em filtros para impedir que chatbots ensinem práticas ilegais, forneçam detalhes sobre crimes ou divulguem informações consideradas sensíveis.

Leia também: SpaceX cai mais de 3% após perder US$ 400 bilhões em valor de mercado

De acordo com o The Washington Post, a ideia é permitir que os sistemas respondam a perguntas úteis sem oferecer orientações que possam causar danos.

Na prática, porém, esses filtros nem sempre conseguem identificar quando uma solicitação é apresentada de forma indireta.

Em vez de fazer uma pergunta proibida de maneira explícita, alguns usuários reformulam o pedido utilizando contextos criativos ou fictícios.

Histórias e personagens como brechas na segurança de I.A

Uma das estratégias mais conhecidas consiste em pedir que a inteligência artificial interprete um personagem imaginário que não segue regras ou restrições.

O chatbot é levado a responder como se estivesse assumindo outra identidade, o que pode enfraquecer os mecanismos de proteção.

Leia mais: Ações da SpaceX estendem queda após estreia recorde na bolsa

Também há casos em que perguntas sensíveis são transformadas em histórias de ficção, diálogos ou narrativas inspiradas em contos.

Ao interpretar a solicitação como um exercício criativo, alguns sistemas acabam fornecendo detalhes que normalmente seriam bloqueados.

Especialistas em segurança digital afirmam que esse tipo de abordagem explora justamente a característica que tornou os chatbots populares, a capacidade de compreender contextos variados e produzir textos naturais.

Times Brasil - CNBC

Siga o Times | CNBC no Google e receba as principais notícias do Brasil e do Mundo.

Siga o Times | CNBC

Leia também: Participação de Musk na SpaceX supera US$ 1 trilhão; veja outros bilionários acionistas da empresa

O uso de poemas para driblar filtros

Pesquisadores de segurança em inteligência artificial identificaram outro método que tem chamado atenção: o uso de poemas.

Nesse tipo de tentativa, o usuário insere o tema proibido dentro de versos, rimas ou textos literários. Como o pedido parece fazer parte de uma produção artística, alguns modelos interpretam a solicitação de forma diferente e acabam revelando informações que seus filtros deveriam impedir.

Leia também: SpaceX recebeu grau de investimento de Moody’s, S&P e Fitch simultaneamente

A técnica ganhou destaque entre pesquisadores porque demonstra como a linguagem criativa pode confundir sistemas treinados para identificar apenas pedidos diretos.

Desafio sem solução definitiva para I.A

Especialistas reconhecem que eliminar completamente essas falhas é uma tarefa complexa. Os modelos de inteligência artificial aprendem a partir de enormes volumes de dados e carregam internamente conhecimento sobre inúmeros assuntos.

Por esse motivo, o desafio não está apenas em remover informações consideradas perigosas, mas em impedir que elas sejam acessadas por meio de perguntas formuladas de maneiras inesperadas.

Enquanto empresas desenvolvem novos mecanismos de proteção, pesquisadores alertam que usuários continuam criando abordagens cada vez mais sofisticadas para testar os limites dos sistemas.

Leia também: Acordo de US$ 60 bi mostra que SpaceX não é empresa de foguetes

O resultado é uma disputa permanente entre a evolução das barreiras de segurança e as técnicas usadas para contorná-las.

📌 ONDE ASSISTIR AO MAIOR CANAL DE NEGÓCIOS DO MUNDO NO BRASIL:


🔷 Canal 562 ClaroTV+ | Canal 562 Sky | Canal 592 Vivo | Canal 187 Oi | Operadoras regionais

🔷 TV SINAL ABERTO: parabólicas canal 562

🔷 ONLINE: www.timesbrasil.com.br | YouTube

🔷 FAST Channels: Samsung TV Plus, LG Channels, TCL Channels, Pluto TV, Roku, Soul TV, Zapping | Novos Streamings

Siga o Times Brasil - Licenciado Exclusivo CNBC no

MAIS EM Tecnologia & Inovação

Tecnologia: Snap aposta em óculos de US$ 2 mil para convencer usuários a largar smartphones; veja Quantos gols Messi precisou para se tornar o maior artilheiro da história das Copas? Copa do Mundo: figurinha de Messi é vendida por mais de R$ 3 mil na Argentina Copa do Mundo pode aumentar casos de vício em apostas esportivas; entenda ‘Toy Story’: Woody e Buzz envelheceram? A estratégia da Disney para transformar nostalgia em receita BTS pode adicionar bilhões à economia da Coreia do Sul; entenda Quanto custa reunir amigos em casa para assistir aos jogos da Copa do Mundo de 2026? Turismo na Coreia do Sul vive alta histórica; entenda o fenômeno por trás do crescimento Quanto o Flamengo recebe da Copa do Mundo 2026 por jogadores convocados? O que justifica um valuation de mais de US$ 2 trilhões para a SpaceX?