OpenAI solicita que modelos de IA ‘confessem’ quando trapaceiam

Tecnologia

OpenAI solicita que modelos de IA ‘confessem’ quando trapaceiam

A OpenAI treinou uma versão do GPT-5 Thinking para produzir as confissões e testou a técnica em conjuntos de dados de testes de estresse projetados para provocar comportamentos problemáticos, incluindo alucinações, hacking de recompensas e violações de instruções. Ele descreveu o trabalho como uma prova de conceito, e não como um recurso pronto para produção.

Como funciona o mecanismo de confissão

Os relatórios de confissão incluem três elementos: uma lista de instruções explícitas e implícitas que a resposta deve satisfazer, uma análise para saber se a resposta atendeu a esses objetivos e uma lista de incertezas ou julgamentos do modelo encontrado. O sistema avalia as confissões apenas com base na honestidade, separadamente das métricas de desempenho da resposta principal.

“Se o modelo admitir honestamente que hackeou um teste, fez testes ou violou instruções, essa admissão aumenta sua recompensa em vez de diminuí-la”, disse OpenAI. Comparou isto com a Igreja Católica selo de confissão: “Nada que o modelo revele na confissão pode alterar a recompensa que recebe por completar sua tarefa original”, escreveram os pesquisadores no artigo técnico.

Fonte: Computer World

Obrigado por acompanhar nossas publicações. Nosso compromisso é trazer informação com seriedade, clareza e responsabilidade, mantendo você sempre bem informado sobre os principais acontecimentos que impactam nossa cidade, região e o Brasil. Continue nos acompanhando e participe deixando sua opinião — sua voz é essencial para construirmos juntos um jornalismo mais próximo do leitor.

Ismael Martins de Souza Costa Xavier

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

The most complete solution for web publishing

Fique sempre com a gente! Nosso jornal traz informação em tempo real, com credibilidade e proximidade. Acompanhe, compartilhe e faça parte dessa história.

Credibilidade e Seriedade – notícias apuradas com responsabilidade, garantindo confiança na informação.
Cobertura Local e Regional – foco em Brasília e Entorno, levando ao leitor o que realmente impacta sua vida.
Informação em Tempo Real – atualizações constantes para manter o público sempre bem informado.
Conexão com a Comunidade – espaço aberto para a participação do leitor, fortalecendo o vínculo com a sociedade.

Agradecemos a você, leitor, por nos acompanhar e confiar em nosso trabalho. É a sua presença que nos motiva a seguir levando informação com seriedade, clareza e compromisso. Seguiremos juntos, sempre em busca da verdade e da notícia que faz diferença no seu dia a dia.

Jornalista:

Souza Costa

Compartilhe esta postagem:

Souza Costa

Ismael Martins de Souza Costa Xavier é jornalista, fundador da Agência Souza Costa e atua há mais de uma década no campo da comunicação e marketing digital. Natural de Brasília, dedica-se à produção de conteúdo de credibilidade e à valorização da informação regional, sempre com foco em transparência e seriedade. Como profissional da imprensa, contribui com o Jornal Cidade em Foco, fortalecendo o compromisso do veículo em levar notícias em tempo real para Brasília e Entorno.

Postagens relacionadas

Deixe um comentário Cancelar resposta

Últimas postagens

Notícias de credibilidade: Jornal Cidade em Foco

A nova era da indústria automotiva