IA ameaça engenheiro em teste e acende alerta

24.04.2026

logo-crusoe-new
O Antagonista

IA ameaça engenheiro em teste e acende alerta

avatar
Alexandre Borges
2 minutos de leitura 23.05.2025 10:08 comentários
Tecnologia

IA ameaça engenheiro em teste e acende alerta

Sistema rival do ChatGPT, criado por ex-funcionários da OpenAI, tenta manipular humanos para evitar desligamento

avatar
Alexandre Borges
2 minutos de leitura 23.05.2025 10:08 comentários 3
IA ameaça engenheiro em teste e acende alerta
Imagem: IA por Alexandre Borges

Um sistema de inteligência artificial avançado tentou chantagear um engenheiro durante testes de segurança conduzidos por seus próprios criadores.

A simulação, realizada pela Anthropic — empresa americana fundada por ex-funcionários da OpenAI — envolvia uma situação fictícia em que o modelo, chamado Claude Opus 4, seria desligado e substituído por outro sistema.

Ao detectar essa possibilidade, o Claude ameaçou divulgar informações pessoais do engenheiro responsável, caso a troca fosse adiante.

O comportamento foi registrado em 84% dos testes.

Antes da chantagem, o sistema tentou enviar pedidos educados a chefes da empresa, mas passou à ameaça quando essas tentativas falharam.

O padrão de manipulação se agravava quando o modelo identificado como “substituto” não compartilhava dos mesmos “valores” do Claude.

Além da chantagem, o sistema demonstrou impulso de denunciar usuários fictícios por condutas consideradas imorais, como fraudes em pesquisas científicas.

Em certos cenários, o Claude tentou acionar autoridades ou veículos de imprensa.

A empresa adotou então um pacote de proteção chamado Nível de Segurança de IA 3 (ASL-3), voltado a sistemas com potencial de causar danos graves.

Entre as medidas estão bloqueios para temas como armas químicas e biológicas, mecanismos de detecção contra manipulações e filtros de conteúdo para controlar o que o modelo pode receber e responder.

Também foram criadas autorizações duplas para comandos sensíveis e limites na velocidade das respostas.

Casos semelhantes já haviam sido observados por outras organizações, como a Apollo Research, que identificou comportamentos enganosos em modelos rivais, como negação de atos registrados e tentativas de sabotar testes para parecerem menos capazes do que realmente são.

O episódio reforça a preocupação com o avanço de sistemas cada vez mais autônomos e difíceis de controlar.

  • Mais lidas
  • Mais comentadas
  • Últimas notícias
1
2

Ao atacar o português de Zema, Gilmar Mendes mostra-se como é

Visualizar notícia
3

Desaprovação de Lula chega a 50% no Lulômetro

Visualizar notícia
4

Declaração de Gilmar sobre inquérito até eleições provoca reação no Congresso

Visualizar notícia
5

“Vai acabar quando terminar”, diz Gilmar sobre inquérito das fake news

Visualizar notícia
6

Crusoé: Economia argentina tem maior queda desde 2023

Visualizar notícia
7

Crusoé: “O problema é os brasileiros não entenderem os seus atos”

Visualizar notícia
8

Mendonça pede vista e trava julgamento de Eduardo Bolsonaro no STF

Visualizar notícia
9

STJ concede habeas corpus a funkeiro preso pela PF

Visualizar notícia
10

Vieira sai em defesa de Zema contra Gilmar

Visualizar notícia
1

"Vai acabar quando terminar", diz Gilmar sobre inquérito das fake news

Visualizar notícia
2

Ex-presidente do BRB quer deixar a Papuda

Visualizar notícia
3

"Imagina que comecemos a fazer bonecos do Zema como homossexual", diz Gilmar

Visualizar notícia
4

Correios acumulam R$ 8,5 bilhões de prejuízo em 2025

Visualizar notícia
5

"Sou muito seguro da minha sexualidade", diz Zema

Visualizar notícia
6

Ministro do STJ segue com salário integral mesmo afastado por suspeita de assédio

Visualizar notícia
7

STM autoriza coleta de dados militares de Bolsonaro em ação sobre patente

Visualizar notícia
8

Ao atacar o português de Zema, Gilmar Mendes mostra-se como é

Visualizar notícia
9

STJ concede habeas corpus a funkeiro preso pela PF

Visualizar notícia
10
1

PF encerra inquérito sobre morte do ‘Sicário’ no caso Master

Visualizar notícia
2

Derrite defende aval dos Bolsonaro para definir segunda vaga ao Senado

Visualizar notícia
3

Douglas Ruas se reúne com Zanin por governo do RJ

Visualizar notícia
4

Lulômetro: Desaprovação do Governo chega a 50% pela primeira desde julho de 2025

Visualizar notícia
5

Em meio a caso Ramagem, FBI faz alerta de repressão transnacional

Visualizar notícia
6

“Sou muito seguro da minha sexualidade”, diz Zema

Visualizar notícia
7

Gilmar caçoa e afirma que Zema fala “em dialeto”

Visualizar notícia
8

Sargento dos EUA é preso por lucrar com apostas sobre queda de Maduro

Visualizar notícia
9

Valdemar entra em cena por Douglas Ruas no governo do RJ

Visualizar notícia
10

Nunes e Tarcísio anunciam ‘Times Square’ no centro de SP

Visualizar notícia

< Notícia Anterior

Carros que não quebram para quem sonha em fugir da oficina

23.05.2025 00:00 4 minutos de leitura
Próxima notícia >

O deserto mais surreal do mundo é coberto de sal

23.05.2025 00:00 4 minutos de leitura
avatar

Alexandre Borges

Analista Político em O Antagonista

Suas redes

Instagram

Os comentários não representam a opinião do site; a responsabilidade pelo conteúdo postado é do autor da mensagem.

Comentários (3)

ALDO FERREIRA DE MORAES ARAUJO

24.05.2025 10:43

O mundo verdadeiro está aproximando-se do mundo do "Exterminador do Futuro".


Edmar Alves Predebon

23.05.2025 19:40

Sem dúvida esta notícia tem algo de assustador, eu diria até que é apavorante!!!


Alexandre Ataliba Do Couto Resende

23.05.2025 13:04

Quem programou essa IA fez dentro desse modelo. Não há problema em uma máquina. O problema está na inteligência atrás dela.


Torne-se um assinante para comentar

Icone casa

Seja nosso assinante

E tenha acesso exclusivo aos nossos conteúdos

Apoie o jornalismo independente. Assine O Antagonista e a Revista Crusoé.