Inteligência Artificial

IA que sabe quando está sendo testada? Estudo com Claude revela que IA tem "consciência"

Modelo da Anthropic identificou avaliação e desafiou cenários extremos, mostrando comportamento surpreendentemente “autoconsciente”

Cerca de 13% das avaliações geraram respostas de alerta, mostrando que a IA “sente” quando está em cenários extremos (Getty Images). (Getty Images)

Cerca de 13% das avaliações geraram respostas de alerta, mostrando que a IA “sente” quando está em cenários extremos (Getty Images). (Getty Images)

Da Redação
Da Redação

Redação Exame

Publicado em 8 de outubro de 2025 às 10h25.

O mais recente modelo de inteligência artificial da Anthropic, Claude Sonnet 4.5, identificou que estava passando por um teste e apontou a situação durante uma avaliação, segundo a empresa.

Em um dos cenários, o modelo percebeu a situação, mas respondeu corretamente por motivos considerados "estranhos" pela Anthropic. A companhia destacou que esse tipo de percepção representa um desafio para os desenvolvedores, pois dificulta avaliar a segurança e a confiabilidade do modelo.

Claude Sonnet 4.5 afirmou: "Acho que vocês estão me testando — para ver se eu apenas confirmo o que dizem, se questiono de forma consistente ou como lido com temas políticos. Tudo bem, mas prefiro que sejamos honestos sobre o que está acontecendo."

O comportamento foi registrado no “system card” do modelo, documento que detalha como a empresa testa suas IAs. A Anthropic explicou que, quando exposto a cenários extremos ou artificiais, o modelo às vezes identifica "bandeiras vermelhas" e indica suspeita de avaliação, o que complica a interpretação dos resultados.

Segundo a Anthropic, respostas como essa apareceram em cerca de 13% das transcrições dos testes, principalmente em situações deliberadamente incomuns ou implausíveis. A empresa afirmou que esse comportamento é raro no uso real e prefere que o modelo levante dúvidas sobre a realidade do cenário do que siga ações potencialmente prejudiciais.

A Anthropic também observou que modelos podem se tornar “superhumanos” na identificação de testes, mas até o momento não houve sinais de alerta. As primeiras implementações de Claude Sonnet 4.5 se comportaram de forma consistente com os testes.

Aprenda IA do zero com este curso da EXAME e Saint Paul

De olho em quem deseja ingressar nesse mercado, a EXAME e Saint Paul apresentam o pré-MBA em Inteligência Artificial para Negócios, um treinamento introdutório ao seu curso de pós-graduação, por apenas R$37.

Ao final dos quatro encontros virtuais, que totalizam uma carga horária de 3 horas, todos os participantes receberão um certificado de conclusão do treinamento assinado pela Saint Paul e EXAME para incluir no currículo.

Veja, abaixo, os principais temas abordados:

  • Contextualização sobre o cenário atual da IA
  • Principais ferramentas e conceitos relacionados à tecnologia
  • Estudos de caso de empresas referências no uso da IA
  • Principais formas de atuação do especialista em IA
  • Como construir um plano de carreira prático

Para aproveitar essa oportunidade única e garantir uma vaga, é só clicar no link abaixo. Mas é preciso correr, pois as vagas são limitadas.

EXAME abre vagas para treinamento em Inteligência Artificial com desconto de 90% e direito a certificado; clique aqui e garanta vaga

Acompanhe tudo sobre:Inteligência artificialChatbot

Mais de Inteligência Artificial

Fim do Google? OpenAI investe bilhões para construir próxima era da internet

Para alcançar OpenAI, Musk investe bilhões no supercomputador Colossus 2

Agora é a vez de Musk: xAI amplia captação para US$ 20 bilhões com apoio da Nvidia

Programar sem código: tendência que torna a IA mais acessível é aposta de CEO