Atlas: Avaliação de Desempenho em Tarefas Web

Publicidade

Desempenho do Agente Atlas em Tarefas Web

Resultados: Durante os testes, o agente Atlas iniciou sua busca por “demonstração” em vez de navegar diretamente para a categoria “Demos gratuitas”. Apesar de encontrar o filtro para macOS, o agente gastou tempo considerável procurando um filtro específico para “tem demo”, mesmo que a busca inicial já tivesse restringido os resultados.

Esta página de resultados foi o máximo que o agente Atlas alcançou ao buscar demonstrações de jogos. Crédito: Kyle Orlando

Após um tempo prolongado, o agente clicou no principal resultado da página, que era a novela visual Projeto II: Vale do Silêncio. Embora houvesse um link destacado para “Download Demo”, o agente expressou preocupação porque o jogo completo estava na página do Steam, e não uma demonstração. Ele voltou à página de resultados e tentou novamente.

Após observar esse ciclo por quase dez minutos, interrompi o agente e encerrei o teste.

Avaliação: 1/10. Embora tenha encontrado algumas demonstrações de jogos para macOS, o agente não conseguiu realizar o download.

Conclusão dos Testes

Em seis tarefas variadas baseadas na web, o agente Atlas obteve uma mediana de 7,5 pontos (média de 6,83) em uma escala de 10 pontos. Esse desempenho foi melhor do que o esperado para um recurso em fase de testes intensivos pela OpenAI.

O Atlas demonstrou capacidade de interpretar solicitações e navegar por páginas web com cuidado, embora lentamente. Ele conseguiu contornar obstáculos inesperados e navegar por menus simples na maioria das vezes, apesar de ocasionalmente ficar preso em loops infinitos.

O principal limitador foi a “duração da sessão”, que restringiu a maioria das tarefas a alguns minutos. Isso impacta negativamente a utilidade do agente, especialmente considerando o tempo que ele leva para decidir onde clicar. Uma versão que funcionasse em segundo plano indefinidamente teria melhorado significativamente os resultados.

No geral, o “Modo Agente” do Atlas ainda não é confiável para automação completa, mas pode ser útil para tarefas simples e repetitivas que requerem verificação humana posterior.

O que é o Agente Atlas?

O Agente Atlas é uma ferramenta de automação web desenvolvida pela OpenAI para realizar tarefas online de forma automatizada.

Quais são as limitações do Agente Atlas?

As principais limitações incluem a duração da sessão, que restringe tarefas a poucos minutos, e a lentidão na navegação e tomada de decisões.

O Agente Atlas é recomendado para automação completa?

Atualmente, não. Ele é mais adequado para tarefas simples e repetitivas que podem ser verificadas posteriormente por um humano.

Subscribe
Notificar de
guest
0 Comentários
Mais antigo
O mais novo Mais Votados
Feedbacks embutidos
Ver todos os comentários

Publicidade

Publicidade