Desempenho do Agente Atlas em Tarefas Web
Resultados: Durante os testes, o agente Atlas iniciou sua busca por “demonstração” em vez de navegar diretamente para a categoria “Demos gratuitas”. Apesar de encontrar o filtro para macOS, o agente gastou tempo considerável procurando um filtro específico para “tem demo”, mesmo que a busca inicial já tivesse restringido os resultados.
Após um tempo prolongado, o agente clicou no principal resultado da página, que era a novela visual Projeto II: Vale do Silêncio. Embora houvesse um link destacado para “Download Demo”, o agente expressou preocupação porque o jogo completo estava na página do Steam, e não uma demonstração. Ele voltou à página de resultados e tentou novamente.
Após observar esse ciclo por quase dez minutos, interrompi o agente e encerrei o teste.
Avaliação: 1/10. Embora tenha encontrado algumas demonstrações de jogos para macOS, o agente não conseguiu realizar o download.
Conclusão dos Testes
Em seis tarefas variadas baseadas na web, o agente Atlas obteve uma mediana de 7,5 pontos (média de 6,83) em uma escala de 10 pontos. Esse desempenho foi melhor do que o esperado para um recurso em fase de testes intensivos pela OpenAI.
O Atlas demonstrou capacidade de interpretar solicitações e navegar por páginas web com cuidado, embora lentamente. Ele conseguiu contornar obstáculos inesperados e navegar por menus simples na maioria das vezes, apesar de ocasionalmente ficar preso em loops infinitos.
O principal limitador foi a “duração da sessão”, que restringiu a maioria das tarefas a alguns minutos. Isso impacta negativamente a utilidade do agente, especialmente considerando o tempo que ele leva para decidir onde clicar. Uma versão que funcionasse em segundo plano indefinidamente teria melhorado significativamente os resultados.
No geral, o “Modo Agente” do Atlas ainda não é confiável para automação completa, mas pode ser útil para tarefas simples e repetitivas que requerem verificação humana posterior.
O que é o Agente Atlas?
O Agente Atlas é uma ferramenta de automação web desenvolvida pela OpenAI para realizar tarefas online de forma automatizada.
Quais são as limitações do Agente Atlas?
As principais limitações incluem a duração da sessão, que restringe tarefas a poucos minutos, e a lentidão na navegação e tomada de decisões.
O Agente Atlas é recomendado para automação completa?
Atualmente, não. Ele é mais adequado para tarefas simples e repetitivas que podem ser verificadas posteriormente por um humano.

