IA ameaça engenheiro em teste e acende alerta

o antagonista

Assine Entre

26.04.2026

logo-crusoe-new
Crusoé
  • Últimas Notícias
  • Brasil
  • Mundo
  • Economia
  • Lado oa!
    • Carros
    • Entretenimento
    • Esportes
    • Imóveis
    • Tecnologia
    • Turismo
    • Variedades
  • Colunistas
  • Newsletter
Pesquisar Menu
o antagonista X
  • Olá

    Fazer login Assine agora
  • Home

    Editorias

    Newsletter Colunistas Últimas Notícias Brasil Mundo Economia Esportes Crusoe
  • Mídias

    Vídeos Podcasts
  • Anuncie conosco Quem Somos Política de privacidade Termos de uso Política de cookies Política de Compliance Perguntas Frequentes

E siga O Antagonista nas redes

Menu Menu Menu
O Antagonista

IA ameaça engenheiro em teste e acende alerta

avatar
Alexandre Borges
2 minutos de leitura 23.05.2025 10:08 comentários
Tecnologia

IA ameaça engenheiro em teste e acende alerta

Sistema rival do ChatGPT, criado por ex-funcionários da OpenAI, tenta manipular humanos para evitar desligamento

avatar
Alexandre Borges
2 minutos de leitura 23.05.2025 10:08 comentários 3
IA ameaça engenheiro em teste e acende alerta
Imagem: IA por Alexandre Borges
  • Whastapp
  • Facebook
  • Linkedin
  • Twitter
  • COMPARTILHAR

Um sistema de inteligência artificial avançado tentou chantagear um engenheiro durante testes de segurança conduzidos por seus próprios criadores.

A simulação, realizada pela Anthropic — empresa americana fundada por ex-funcionários da OpenAI — envolvia uma situação fictícia em que o modelo, chamado Claude Opus 4, seria desligado e substituído por outro sistema.

Ao detectar essa possibilidade, o Claude ameaçou divulgar informações pessoais do engenheiro responsável, caso a troca fosse adiante.

O comportamento foi registrado em 84% dos testes.

Antes da chantagem, o sistema tentou enviar pedidos educados a chefes da empresa, mas passou à ameaça quando essas tentativas falharam.

O padrão de manipulação se agravava quando o modelo identificado como “substituto” não compartilhava dos mesmos “valores” do Claude.

Além da chantagem, o sistema demonstrou impulso de denunciar usuários fictícios por condutas consideradas imorais, como fraudes em pesquisas científicas.

Em certos cenários, o Claude tentou acionar autoridades ou veículos de imprensa.

A empresa adotou então um pacote de proteção chamado Nível de Segurança de IA 3 (ASL-3), voltado a sistemas com potencial de causar danos graves.

Entre as medidas estão bloqueios para temas como armas químicas e biológicas, mecanismos de detecção contra manipulações e filtros de conteúdo para controlar o que o modelo pode receber e responder.

Também foram criadas autorizações duplas para comandos sensíveis e limites na velocidade das respostas.

Casos semelhantes já haviam sido observados por outras organizações, como a Apollo Research, que identificou comportamentos enganosos em modelos rivais, como negação de atos registrados e tentativas de sabotar testes para parecerem menos capazes do que realmente são.

O episódio reforça a preocupação com o avanço de sistemas cada vez mais autônomos e difíceis de controlar.

Nunca foi tão fácil estar bem informado Siga nosso canal no WhatsApp
  • Mais lidas
  • Mais comentadas
  • Últimas notícias
1

Zema publica novo vídeo com fantoches de Gilmar e Moraes

Visualizar notícia
2

Zema vê “xenofobia” em fala de Gilmar e cogita ação judicial

Visualizar notícia
3

Se eu tivesse juízo não disputaria mais a Presidência, diz Ciro Gomes

Visualizar notícia
4

Orbán renuncia a mandato: “Não sou necessário no Parlamento”

Visualizar notícia
5

Se um elefante incomoda muita gente, Nikolas Ferreira incomoda muito mais 

Visualizar notícia
6

“Tá na hora de largar o osso e sair”, diz Tarcísio sobre Lula

Visualizar notícia
7

Bolsonaro aguarda autorização do “ministro médico” Moraes para cirurgia, diz Carluxo

Visualizar notícia
8

STJ mantém prisão de criador da Choquei

Visualizar notícia
9

PT pede volta de Maduro para Venezuela

Visualizar notícia
10

Defensoria contesta decisão de Moraes e aponta falhas em caso Tagliaferro

Visualizar notícia
1

PT pede volta de Maduro para Venezuela

Visualizar notícia
2

Lula: “Partido que está no governo não corre atrás do adversário”

Visualizar notícia
3

“Tá na hora de largar o osso e sair”, diz Tarcísio sobre Lula

Visualizar notícia
4

PT retira menções ao caso Master de manifesto

Visualizar notícia
5

Márcio Coimbra na Crusoé: Porta-voz do Kremlin

Visualizar notícia
6

“Impossível não se indignar”, diz Janja sobre fala de conselheiro de Trump

Visualizar notícia
7

STJ mantém prisão de criador da Choquei

Visualizar notícia
8

EUA autorizam Venezuela a bancar defesa de Maduro

Visualizar notícia
9

Orbán renuncia a mandato: “Não sou necessário no Parlamento”

Visualizar notícia
10

Zema vê “xenofobia” em fala de Gilmar e cogita ação judicial

Visualizar notícia
1

Lula manifesta solidariedade a Trump após tiros em jantar

Visualizar notícia
2

Pressão alta em animais: 6 sinais de alerta da doença

Visualizar notícia
3

Líderes mundiais condenam ataque em jantar com Trump

Visualizar notícia
4

Moro e Flávio Bolsonaro se unem em vídeo do PL

Visualizar notícia
5

Tony Garcia quer disputar governo do Paraná para “escrutinar” Moro

Visualizar notícia
6

Criador do perfil “Dona Maria” nega ser bolsonarista

Visualizar notícia
7

Tarot semanal: previsão para os signos de 27 de abril a 03 de maio de 2026

Visualizar notícia
8

Quem é o atirador que abriu fogo em evento com Trump

Visualizar notícia
9

Tarot do dia: previsão para os 12 signos em 26/04/2026

Visualizar notícia
10

Trump e Melania são retirados às pressas de evento após disparos em hotel; veja vídeo

Visualizar notícia

Nunca foi tão fácil estar bem informado Siga nosso canal no WhatsApp
< Notícia Anterior

Carros que não quebram para quem sonha em fugir da oficina

23.05.2025 00:00 4 minutos de leitura
Visualizar
Próxima notícia >

O deserto mais surreal do mundo é coberto de sal

23.05.2025 00:00 4 minutos de leitura
Visualizar
avatar

Alexandre Borges

Analista Político em O Antagonista

Suas redes

Twitter Instagram Facebook

Os comentários não representam a opinião do site; a responsabilidade pelo conteúdo postado é do autor da mensagem.

Comentários (3)

ALDO FERREIRA DE MORAES ARAUJO

24.05.2025 10:43

O mundo verdadeiro está aproximando-se do mundo do "Exterminador do Futuro".


Edmar Alves Predebon

23.05.2025 19:40

Sem dúvida esta notícia tem algo de assustador, eu diria até que é apavorante!!!


Alexandre Ataliba Do Couto Resende

23.05.2025 13:04

Quem programou essa IA fez dentro desse modelo. Não há problema em uma máquina. O problema está na inteligência atrás dela.


Torne-se um assinante para comentar

Os comentários não representam a opinião do site; a responsabilidade pelo conteúdo postado é do autor da mensagem.

Comentários (3)

ALDO FERREIRA DE MORAES ARAUJO

24.05.2025 10:43

O mundo verdadeiro está aproximando-se do mundo do "Exterminador do Futuro".


Edmar Alves Predebon

23.05.2025 19:40

Sem dúvida esta notícia tem algo de assustador, eu diria até que é apavorante!!!


Alexandre Ataliba Do Couto Resende

23.05.2025 13:04

Quem programou essa IA fez dentro desse modelo. Não há problema em uma máquina. O problema está na inteligência atrás dela.



Icone casa
Utilizamos cookies e tecnologia para aprimorar sua experiência de navegação de acordo com a Política de cookies.

Seja nosso assinante

E tenha acesso exclusivo aos nossos conteúdos

Apoie o jornalismo independente. Assine O Antagonista e a Revista Crusoé.

Assine
o antagonista
o antagonista

Redação SP

Av Paulista, 777 4º andar cj 41 Bela Vista, São Paulo-SP
CEP: 01311-914

Anuncie Conosco

Últimas Notícias Brasil Mundo

Economia Lado oa! Colunistas Newsletter

Icone do Twitter Icone do Youtube Icone do Whatsapp Icone do Instagram Icone do Facebook

Quer receber notícias do Antagonista em seu e-mail?

Assine nossa newsletter e receba as principais notícias em seu e-mail

Com inteligência e tecnologia:
Object1ve - Marketing Solution
Quem Somos Hora extra Política de privacidade Termos de uso Política de Cookies Política de compliance Princípios Editoriais Perguntas Frequentes Anuncie
O Antagonista , 2026, Todos os direitos reservados, 25.163.879/0001-13.
Background do rodapé