OpenAI traz GPT-4.1 e 4.1 Mini para ChatGPT-o que as empresas devem saber

Publicidade

Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais


O OpenAI está lançando o GPT-4.1, seu novo modelo de idioma grande não raciocínio (LLM) que equilibra alto desempenho com menor custo, para usuários do ChatGPT. A empresa está começando com seus assinantes pagantes no ChatGPT Plus, Pro e Team, com acesso ao usuário da empresa e da educação esperado nas próximas semanas.

Também está adicionando o GPT-4.1 Mini, que substitui o GPT-4O Mini como o padrão para todos os usuários do ChatGPT, incluindo os da camada gratuita. A versão “mini” fornece um parâmetro de escala menor e, portanto, uma versão menos poderosa com padrões de segurança semelhantes.

Os modelos estão disponíveis através da seleção suspensa “mais modelos” no canto superior da janela de bate-papo no ChatGPT, oferecendo aos usuários flexibilidade para escolher entre GPT-4.1, GPT-4.1 Mini e modelos de raciocínio como O3, O4-Mini e O4-Mini-Alto.

Inicialmente destinado ao uso apenas por software de terceiros e desenvolvedores de IA através da interface de programação de aplicativos (API) da OpenAI, foi adicionada GPT-4.1 ao ChatGPT após um forte feedback do usuário.

A liderança da pesquisa de pós -treinamento do Openai Post, Michelle Pokrass, confirmou em X a mudança foi impulsionada pela demanda, escrevendo: “Estávamos inicialmente planejando manter essa API do modelo apenas, mas todos vocês queriam no chatgpt 🙂 Codificação feliz!”

O diretor de produtos do Openai, Kevin Weil, postou no X dizendo: “Nós o construímos para desenvolvedores, por isso é muito bom em codificação e instruções a seguir – dê uma tentativa!”

Um modelo focado na empresa

O GPT-4.1 foi projetado desde o início para a praticidade de nível corporativo.

Lançado em abril de 2025, ao lado do GPT-4.1 Mini e Nano, este modelo Family priorizou as necessidades do desenvolvedor e os casos de uso da produção.

O GPT-4.1 fornece uma melhoria de 21,4 pontos em relação ao GPT-4O na referência de engenharia de software verificada do SWE e um ganho de 10,5 pontos em tarefas de acompanhamento de instruções na referência multichallenge da escala. Também reduz a verbosidade em 50% em comparação com outros modelos, um empreendimento de características elogiou durante os testes antecipados.

Contexto, velocidade e acesso ao modelo

O GPT-4.1 suporta o Windows de contexto padrão para ChatGPT: 8.000 tokens para usuários gratuitos, 32.000 tokens para usuários Plus e 128.000 tokens para usuários profissionais.

De acordo com o desenvolvedor Angel Bogado, postagem em X, esses limites correspondem aos usados ​​pelos modelos anteriores do ChatGPT, embora estejam em andamento os planos para aumentar ainda mais o tamanho do contexto.

Embora as versões da API do GPT-4.1 possam processar até um milhão de tokens, essa capacidade expandida ainda não está disponível no ChatGPT, embora o apoio futuro tenha sido sugerido.

Esse recurso estendido de contexto permite que os usuários da API alimentem bases de código inteiras ou grandes documentos legais e financeiros no modelo-utilizados para revisar contratos de vários documentos ou analisar grandes arquivos de log.

O OpenAI reconheceu alguma degradação do desempenho com insumos extremamente grandes, mas os casos de teste corporativos sugerem desempenho sólido de até várias centenas de milhares de tokens.

Avaliações e segurança

O OpenAI também lançou um site de Hub de Avaliações de Segurança para dar aos usuários acesso às principais métricas de desempenho entre os modelos.

O GPT-4.1 mostra resultados sólidos nessas avaliações. Em testes de precisão factual, ele obteve 0,40 no benchmark SimpleQA e 0,63 no PessoQA, superando vários antecessores.

Também marcou 0,99 na medida “não insegura” do OpenAI em testes de recusa padrão e 0,86 em instruções mais desafiadoras.

No entanto, no teste de Jailbreak StrongReject-uma referência acadêmica de segurança em condições adversárias-o GPT-4.1 marcou 0,23, por trás de modelos como GPT-4O-Mini e O3.

Dito isto, obteve um forte 0,96 em avisos de jailbreak de origem humana, indicando segurança mais robusta no mundo real sob uso típico.

Na adesão de instruções, o GPT-4.1 segue a hierarquia definida do OpenAI (Sistema sobre o desenvolvedor, desenvolvedor sobre mensagens do usuário) com uma pontuação de 0,71 para resolver conflitos do sistema vs. mensagens do usuário. Ele também tem um bom desempenho na salvaguarda frases protegidas e em evitar brindes de soluções nos cenários de tutoria.

Contextualizando o GPT-4.1 contra os antecessores

O lançamento do GPT-4.1 ocorre após o escrutínio em torno do GPT-4.5, que estreou em fevereiro de 2025 como uma prévia da pesquisa. Esse modelo enfatizou melhor aprendizado sem supervisão, uma base de conhecimento mais rica e alucinações reduzidas-caindo de 61,8% no GPT-4O para 37,1%. Também apresentou melhorias nas nuances emocionais e na escrita longa, mas muitos usuários acharam os aprimoramentos sutis.

Apesar desses ganhos, o GPT-4.5 atraiu críticas por seu alto preço-até US $ 180 por milhão de tokens de produção via API-e para desempenho insuficiente em matemática e codificação de referências em relação aos modelos da Série O Openai. Os números da indústria observaram que, embora o GPT-4.5 fosse mais forte em conversas gerais e geração de conteúdo, ela teve um desempenho inferior em aplicativos específicos do desenvolvedor.

Por outro lado, o GPT-4.1 é destinado a uma alternativa mais rápida e mais focada. Embora não tenha a amplitude de conhecimento do GPT-4.5 e a modelagem emocional extensa, é melhor ajustado para assistência prática de codificação e adere de maneira mais confiável às instruções do usuário.

Na API da OpenAI, o GPT-4.1 custa atualmente US $ 2,00 por milhão de tokens de entrada, US $ 0,50 por milhão de tokens de entrada em cache e tokens de produção de US $ 8,00 por milhão.

Para aqueles que buscam um equilíbrio entre velocidade e inteligência a um custo menor, o GPT-4.1 Mini está disponível a US $ 0,40 por milhão de tokens de entrada, US $ 0,10 por milhão de tokens de entrada em cache e US $ 1,60 por milhão de tokens de saída.

Os modelos Flash-Lite e Flash do Google estão disponíveis a partir de US $ 0,075 a US $ 0,10 por milhão de tokens de entrada e US $ 0,30 a US $ 0,40 por milhão de tokens de saída, menos de um décimo o custo das taxas básicas do GPT-4.1.

Mas, embora o GPT-4.1 tenha um preço mais alto, ele oferece benchmarks de engenharia de software mais fortes e seguintes instruções mais precisas, o que pode ser crítico para cenários de implantação corporativa que exigem confiabilidade em relação ao custo. Por fim, o GPT-4.1 da OpenAI oferece uma experiência premium para o desempenho de precisão e desenvolvimento, enquanto os modelos Gemini do Google atraem empresas com consciência de custo que precisam de camadas de modelos flexíveis e recursos multimodais.

O que isso significa para os tomadores de decisão corporativos

A introdução do GPT-4.1 traz benefícios específicos para as equipes corporativas que gerenciam as operações de implantação, orquestração e dados: LLM:

  • Engenheiros de IA supervisionando a implantação pode esperar uma aderência de velocidade e instrução aprimoradas. Para as equipes que gerenciam o ciclo de vida completo do LLM-do modelo de ajuste para solução de problemas-o GPT-4.1 oferece um conjunto de ferramentas mais responsivo e eficiente. É particularmente adequado para equipes enxutas sob pressão para enviar modelos de alto desempenho rapidamente, sem comprometer a segurança ou a conformidade.
  • Ai orquestração leva O foco no design de pipeline escalável apreciará a robustez do GPT-4.1 contra a maioria das falhas induzidas pelo usuário e seu forte desempenho nos testes de hierarquia de mensagens. Isso facilita a integração de sistemas de orquestração que priorizam a consistência, a validação do modelo e a confiabilidade operacional.
  • Engenheiros de dados Responsável por manter a alta qualidade dos dados e integrar novas ferramentas se beneficiarão da menor taxa de alucinação do GPT-4.1 e maior precisão factual. Seu comportamento de saída mais previsível ajuda a criar fluxos de trabalho de dados confiáveis, mesmo quando os recursos da equipe são restritos.
  • Profissionais de segurança de TI Junto encarregado de incorporar a segurança nos pipelines DevOps pode encontrar valor na resistência do GPT-4.1 a jailbreaks comuns e seu comportamento de saída controlado. Enquanto sua pontuação acadêmica de resistência ao jailbreak deixa espaço para melhorias, o alto desempenho do modelo contra explorações de origem humana ajuda a apoiar a integração segura em ferramentas internas.

Nessas funções, o posicionamento do GPT-4.1 como um modelo otimizado para maior clareza, conformidade e eficiência de implantação o torna uma opção atraente para empresas de tamanho médio que desejam equilibrar o desempenho com as demandas operacionais.

Um novo passo à frente

Enquanto o GPT-4.5 representou um marco de escala no desenvolvimento do modelo, o GPT-4.1 se concentra em utilidade. Não é o mais caro ou o mais multimodal, mas oferece ganhos significativos em áreas que importam para as empresas: precisão, eficiência de implantação e custo.

Esse reposicionamento reflete uma tendência mais ampla da indústria – a partir da construção dos maiores modelos a qualquer custo e para tornar os modelos capazes mais acessíveis e adaptáveis. O GPT-4.1 atende a essa necessidade, oferecendo uma ferramenta flexível e pronta para a produção para as equipes que tentam incorporar a IA mais profundamente em suas operações comerciais.

À medida que o OpenAI continua a evoluir suas ofertas de modelos, o GPT-4.1 representa um passo à frente na democratização da IA ​​avançada para ambientes corporativos. Para os tomadores de decisão que equilibram a capacidade de equilíbrio com o ROI, oferece um caminho mais claro para a implantação sem sacrificar o desempenho ou a segurança.

Subscribe
Notificar de
guest
0 Comentários
Mais antigo
O mais novo Mais Votados
Feedbacks embutidos
Ver todos os comentários

Publicidade

Publicidade