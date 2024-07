A OpenAI anunciou um novo modelo de IA chamado CriticGPT, treinado com base no GPT-4 e usado para corrigir possíveis erros em respostas do ChatGPT sobre programação. De acordo com a empresa, pessoas que usam a ferramenta notam melhorias em 60% dos casos.

A ferramenta foi criada para refinar os processos de revisão das respostas do ChatGPT: a OpenAI informa que o chatbot fica mais preciso ao longo do tempo, com erros mais sutis, e isso pode dificultar a vida dos profissionais que analisam imprecisões na plataforma. A solução, então, foi treinar o CriticGPT para escrever críticas que destaquem vulnerabilidades nas respostas, incluindo bugs que passam despercebidos pelos humanos.

A empresa quer integrar modelos similares à novidade nos sistemas de Aprendizado de Reforço por Feedback Humano (RLHF, na sigla em inglês), que usam o treinamento de profissionais para encontrar possíveis erros e comparar respostas do chatbot.

Os resultados colhidos pela empresa revelam que o CriticGPT não acerta em todas as sugestões, mas os treinadores têm desempenho melhor com a ferramenta em comparação com aqueles que não a usam. Os insights oferecidos pela IA ajudam a criar críticas mais compreensíveis e reduzem os riscos de bugs por alucinação da tecnologia (processo quando a IA cria fatos inexistentes ou imprecisos).

Limitações

A ferramenta pode ser útil para detectar bugs, mas a desenvolvedora ainda aponta algumas limitações:

O CriticGPT é treinado apenas em respostas curtas do ChatGPT, então ainda precisa de aprimoramentos para compreender pedidos mais longos;

Os modelos ainda podem causar alucinações e dificultar o trabalho dos treinadores da IA;

A ferramenta pode corrigir um erro individual num código, mas pode deixar passar outros problemas dentro da própria resposta;

O CriticGPT tem dificuldade para ajudar em tarefas muito complexas, até mesmo com a supervisão de experts.

Inicialmente, a ferramenta está disponível apenas para quem trabalha com o treinamento das ferramentas de IA. E por falar em OpenAI, o CEO Sam Altman comentou recentemente que o sucessor do GPT-4, já em desenvolvimento, trará um “salto significativo” em comparação ao modelo atual.