Por que o sucesso do Pokémon do Google Gemini não é tudo o que está rachado para ser

TecnoDicas & Trends
maio 5, 2025

Enquanto a Gemini está usando seu próprio modelo e processo de raciocínio para essas tarefas, é revelador que Joelz teve que enxertar especificamente esses agentes especializados no modelo básico para ajudá -lo a superar alguns dos desafios mais difíceis do jogo. Como Joelz escreve, “minhas intervenções melhoram as habilidades gerais de decisão e raciocínio de Gêmeos”.

O que estamos testando aqui?

Não me interpretem mal, massagear um LLM em uma forma que pode vencer um jogo de Pokémon é definitivamente uma conquista. No entanto, o nível de “intervenção” necessário para ajudar Gêmeos com as coisas que “os LLMs não podem fazer de forma independente ainda é crucial para ter em mente ao avaliar esse sucesso.

O momento em que Gêmeos venceu o Pokémon (com uma pequena ajuda).

Já sabemos que as ferramentas de aprendizado de reforço especialmente projetadas podem vencer os Pokémon com bastante eficiência (e que mesmo um gerador de números aleatórios pode vencer o jogo de maneira ineficiente). A ressonância particular de um teste de “LLM Plays Pokémon” é ver se um modelo de idioma generalizado pode raciocinar sua própria solução para um jogo complicado por conta própria. Quanto mais retenção de mãos damos ao modelo-através de informações externas, ferramentas ou “arreios”-, menos útil o jogo é como esse tipo de teste.

Anthrópica disse em fevereiro que Claude interpreta Pokémon mostrou “vislumbres de sistemas de IA que enfrentam desafios com a crescente competência, não apenas através do treinamento, mas com o raciocínio generalizado”. Mas, como Bradshaw escreve sobre Lesswrong, “sem um arnês de agente refinado, (todos os modelos) têm dificuldade em passar pela primeira tela do jogo, o quarto de Red!” Os testes de jogabilidade subsequentes de Bradshaw com LLMs sem arnês destacam ainda mais como esses modelos frequentemente vagam sem rumo, retrocederam sem sentido ou até alucinar situações impossíveis de jogos.

Em outras palavras, ainda estamos muito longe do tipo de futuro previsto, onde uma inteligência geral artificial pode descobrir uma maneira de vencer os Pokémon apenas porque você pediu.

0 Comentários

Mais antigo

O mais novo Mais Votados

Feedbacks embutidos

Ver todos os comentários

TecnoDicas
& Trends

Por que o sucesso do Pokémon do Google Gemini não é tudo o que está rachado para ser

O que estamos testando aqui?

Os 100 Melhores Manhuas / Manhwas de 2026

Os 100 Melhores Mangás de Todos os Tempos

Que tipo de pessoa você é quando o assunto é dinheiro?

Semana 9 de Gravidez: Sintomas, Desenvolvimento do Bebê e Mudanças no Corpo

O Mistério do Bigode em "Alto Potencial" Explicado

Tudo sobre a 51ª temporada do SNL: Episódios, Datas e Como Assistir

Feliz Natal, Ted Cooper!: Um Filme de Natal Cheio de Charme e Humor

Landman 2ª Temporada: Tudo o que Você Precisa Saber

4ª Temporada de Prefeito de Kingstown: Tudo o que Você Precisa Saber

Paul e Morgan: Rumores de Romance e Novidades no Mundo dos Reality Shows

TecnoDicas
& Trends

Categorias

Informações

Siga-nos

Por que o sucesso do Pokémon do Google Gemini não é tudo o que está rachado para ser

O que estamos testando aqui?

Os 100 Melhores Manhuas / Manhwas de 2026

Os 100 Melhores Mangás de Todos os Tempos

Que tipo de pessoa você é quando o assunto é dinheiro?

Semana 9 de Gravidez: Sintomas, Desenvolvimento do Bebê e Mudanças no Corpo

O Mistério do Bigode em "Alto Potencial" Explicado

Tudo sobre a 51ª temporada do SNL: Episódios, Datas e Como Assistir

Feliz Natal, Ted Cooper!: Um Filme de Natal Cheio de Charme e Humor

Landman 2ª Temporada: Tudo o que Você Precisa Saber

4ª Temporada de Prefeito de Kingstown: Tudo o que Você Precisa Saber

Paul e Morgan: Rumores de Romance e Novidades no Mundo dos Reality Shows

TecnoDicas & Trends

Categorias

Informações

Siga-nos

TecnoDicas
& Trends