Qwen 2.5: O Novo Rei da IA Supera DeepSeek e ChatGPT?

Resumo

O Qwen 2.5-Max, lançado pela Alibaba em janeiro de 2025, supera DeepSeek-V3 e ChatGPT (GPT-4o) em codificação e raciocínio em benchmarks como HumanEval e GPQA-Diamond, com custo bem menor. Embora não seja open-source como o DeepSeek, oferece versatilidade e acessibilidade, mas perde em criatividade para o ChatGPT.

Ponto Central

A corrida pela supremacia na inteligência artificial (IA) ganhou um novo capítulo em 29 de janeiro de 2025, quando a Alibaba lançou o Qwen 2.5-Max, um modelo de linguagem que promete superar gigantes como o DeepSeek-V3 e o ChatGPT da OpenAI. Desenvolvido pela Qwen, divisão de IA da Alibaba, o 2.5-Max é um modelo de 72 bilhões de parâmetros baseado em Mixture-of-Experts (MoE), treinado em mais de 20 trilhões de tokens. Até março de 2025, ele já é celebrado por sua performance em benchmarks como Arena-Hard (89,4% de acurácia) e HumanEval (92,7% em codificação), números que o colocam à frente do GPT-4o e do DeepSeek-V3 em várias métricas. Mas será que ele realmente destrona os líderes?

O Qwen 2.5-Max não é apenas mais um competidor – ele é projetado para eficiência e versatilidade. Com uma janela de contexto de 128 mil tokens e suporte a 29 idiomas, ele lida com tarefas complexas como codificação, matemática e raciocínio avançado. Diferente do ChatGPT, que depende de infraestrutura pesada da OpenAI, ou do DeepSeek, que brilha em eficiência de custo, o Qwen 2.5-Max equilibra poder e acessibilidade. Disponível via API na Alibaba Cloud por US$ 0,38 por milhão de tokens – dez vezes mais barato que o GPT-4o (US$ 5) –, ele atrai empresas e desenvolvedores. No Brasil, onde o custo é fator decisivo, isso pode ser um diferencial.

Comparação Frente a Frente

Em testes práticos, o Qwen 2.5-Max se destaca. Na codificação, supera o ChatGPT (GPT-4o) com 92,7% no HumanEval contra 90,1%, e o DeepSeek-V3 com 88,9%. Em raciocínio, atinge 60,1% no GPQA-Diamond, frente a 58,3% do Claude 3.5 Sonnet, um rival próximo do ChatGPT. O DeepSeek-V3, com seus 671 bilhões de parâmetros, impressiona pela eficiência (US$ 0,14 por milhão de tokens), mas perde em tarefas criativas e multitarefa, onde o Qwen brilha. Já o ChatGPT, embora versátil e conversacional, fica caro e menos personalizável por ser proprietário.

O Que os Usuários Dizem?

No X, o sentimento é positivo. Usuários como @_terrion_ (14/03/2025) elogiam o Qwen 2.5 em análises ecológicas, dizendo: ‘Tô achando bem melhor que o DeepSeek e não sinto falta do ChatGPT.’ Outros, como @ai_for_success, destacam sua gratuidade no Qwen Chat e desempenho superior ao DeepSeek-V3. Mas há ressalvas: o Qwen não é totalmente open-source como o DeepSeek, o que limita customizações, e sua performance cai em tarefas criativas, onde o ChatGPT ainda lidera.

Aqui está uma tabela comparativa:

Modelo	Pontos Fortes	Fraquezas
Qwen 2.5-Max	Codificação, custo, multilingue	Não open-source, criatividade limitada
DeepSeek-V3	Eficiência, preço baixo, open-source	Menor versatilidade
ChatGPT (GPT-4o)	Conversação, versatilidade	Custo alto, proprietário

Contraponto

Nem todos concordam que o Qwen 2.5-Max é o campeão absoluto. O DeepSeek-V3, com sua abordagem open-source e custo imbatível, é preferido por desenvolvedores que buscam customização. O ChatGPT mantém vantagem em tarefas criativas e conversacionais, onde sua fluidez ainda é referência. Além disso, o Qwen pode degradar em contextos longos acima de 100 mil tokens, e sua falta de transparência sobre treinamento levanta dúvidas éticas, algo que a OpenAI também enfrenta, mas com mais escrutínio global.

Visão do Futuro

Até o fim de 2025, o Qwen 2.5 pode consolidar sua liderança em aplicações técnicas, como educação e desenvolvimento de software, especialmente no Brasil, onde custo importa. A Alibaba planeja avanços em raciocínio com reforço humano, mas a concorrência não dorme: a OpenAI promete modelos melhores, e o DeepSeek pode contra-atacar com versões mais leves. O futuro da IA será uma batalha de eficiência e especialização, com o Qwen bem posicionado, mas não imbatível.

Minha Opinião

O Qwen 2.5-Max me impressiona pela combinação de potência e preço – é um divisor de águas para quem precisa de IA avançada sem gastar fortunas, algo crucial no Brasil. Ele supera o DeepSeek em versatilidade e o ChatGPT em custo-benefício, mas não os enterra. Para tarefas técnicas, é imbatível; para criatividade, ainda prefiro o ChatGPT. A falta de open-source me incomoda, mas vejo o Qwen como um sinal de que a China está mudando o jogo na IA, e isso é empolgante.

Fontes

Alibaba’s Qwen 2.5 Surpasses DeepSeek – Reuters
Qwen 2.5 Max Better Than DeepSeek – Digit.in
Qwen 2.5 vs DeepSeek vs ChatGPT – TechnoSports

Descubra mais sobre Contraponto News

Assine para receber nossas notícias mais recentes por e-mail.