Enquanto Dębiak venceu 500.000 ienes e sobreviveu a sua provação melhor do que o lendário motorista de aço, as finais da turnê mundial do ATCODER empurra os seres humanos e os modelos de IA para seus limites através de desafios de otimização complexos que não têm solução perfeita – apenas para os melhores.
A codificação da maratona testa a resistência humana contra a eficiência da IA
As finais do ATCODER World Tour representa um dos eventos mais exclusivos da programação competitiva, convidando apenas os 12 principais programadores do mundo com base em seu desempenho ao longo do ano anterior. A divisão heurística se concentra nos problemas de otimização “NP-Hard”. Na programação, as heurísticas são técnicas de solução de problemas que encontram soluções suficientes por meio de atalhos e suposições educadas quando as respostas perfeitas levariam muito tempo para calcular.
Todos os concorrentes, incluindo o OpenAI, foram limitados ao hardware idêntico fornecido pelo ATCODER, garantindo um campo de jogo entre os concorrentes humanos e de IA. De acordo com as regras do concurso, os participantes poderiam usar qualquer idioma de programação disponível no ATCODER, sem penalidade por reenvio, mas uma espera obrigatória de cinco minutos entre as submissões.
Resultados da tabela de classificação final para o concurso heurístico da Final Mundial de 2025, mostrando Dębiak (como “Psyho”) no topo.
Crédito: Atcoder
Os resultados finais do concurso mostraram que o PSYHO terminou com uma pontuação de 1.812.272.558.909 pontos, enquanto o modelo do OpenAI (listado como “OpenAIAHC”) marcou 1.654.675.725.406 pontos – uma margem de aproximadamente 9,5 %. O participante artificial da OpenAI, um modelo de raciocínio simulado personalizado semelhante ao O3, ficou em segundo lugar no geral, à frente de outros 10 programadores humanos que se classificaram em rankings de um ano.
O OpenAI caracterizou o segundo lugar como um marco para os modelos de IA em programação competitiva. “Modelos como a O3 classificam entre os 100 melhores em concursos de codificação/matemática, mas até onde sabemos, esse é o primeiro posicionamento dos 3 melhores em um concurso de codificação/matemática principal”, disse um porta-voz da empresa em um email para a ARS Technica. “Eventos como o ATCoder nos dão uma maneira de testar o quão bem nossos modelos podem raciocinar estrategicamente, planejar a horizontes de longa data e melhorar as soluções por tentativa e erro – assim como um humano faria”.