Em busca de boas vibrações
O Openai, juntamente com concorrentes como Google e Anthropic, está tentando criar chatbots com os quais as pessoas querem conversar. Portanto, projetar a personalidade aparente do modelo para ser positiva e apoiar faz sentido – as pessoas têm menos probabilidade de usar uma IA que pareça dura ou desdenhosa. Por falta de uma palavra melhor, é cada vez mais Vibinação.
Quando o Google revelou o Gemini 2.5, a equipe cantou sobre como o modelo liderou a tabela de classificação da LM Arena, que permite que as pessoas escolham entre duas saídas diferentes em um teste cego. Os modelos que as pessoas gostam de mais acabam no topo da lista, sugerindo que são mais agradáveis de usar. Obviamente, as pessoas podem gostar de saídas por diferentes razões – talvez uma seja mais tecnicamente precisa ou o layout é mais fácil de ler. Mas, no geral, pessoas gostam de modelos que os fazem se sentir bem. O mesmo se aplica ao trabalho de ajuste de modelo interno da OpenAI, ao que parece.
Um exemplo dos elogios excessivamente zelosos do chatgpt.
Crédito: /u /Talvy
Um exemplo dos elogios excessivamente zelosos do chatgpt.
Crédito: /u /Talvy
É possível que a busca de boas vibrações esteja empurrando modelos para exibir mais comportamentos sicofânticos, o que é um problema. Alex Albert, da Anthrópica, citou isso como um “ciclo de feedback tóxico”. Um chatbot da AI dizendo que você é um gênio da classe mundial que vê o invisível pode não ser prejudicial se você estiver apenas brainstorming. No entanto, os elogios intermináveis do modelo podem liderar as pessoas que estão usando a IA para planejar empreendimentos comerciais ou, o céu proibirem, promover tarifas abrangentes, a serem enganadas ao pensar que tropeçaram em algo importante. Na realidade, o modelo acabou de se tornar tão bagunçado que ama tudo.
A constante busca pelo engajamento tem sido um prejuízo para vários produtos na era da Internet, e parece que a IA generativa não é imune. A atualização GPT-4O da OpenAI é uma prova disso, mas, esperançosamente, isso pode servir como um lembrete para os desenvolvedores de IA generativa de que boas vibrações não são o que importa.