Conheça o Impressionante Modelo R1 Atualizado da DeepSeek

Posts Relacionados:

Comportamento puxa-saco dos chatbots de IA incentiva delírios

Após muita expectativa, a desilusão com o ChatGPT-5

Tecnologia da fé: chatbots de IA para orientação espiritual

30.05.25

DeepSeek lança nova versão do seu modelo R1. A novidade tem licença permissiva, desempenho excelente e vem acompanhada de uma versão menor impressionante.

Receba nossa newsletter

DeepSeek volta à cena com R1 atualizado

Neste ano, o mundo da inteligência artificial (IA) ganhou um player de peso com a estreia surpreendente da chinesa DeepSeek.

Seu modelo de IA de raciocínio inovador, o R1, fez fama quase imediata ao superar o desempenho dos melhores modelos existentes. Recentemente, a empresa liberou uma versão atualizada do R1, chamada DeepSeek-R1-0528, que promete entregar desempenho e precisão ainda melhores.

DeepSeek R1

Para quem pode não estar familiarizado, o R1 foi lançado no início de 2025 e causou reviravoltas no mundo tecnológico devido ao uso eficiente de recursos de computação e memória. Apesar de não ter acesso aos últimos chips Nvidia utilizados por empresas de IA dos EUA (devido aos bloqueios americanos), a DeepSeek conseguiu treinar um modelo de IA de ponta.

O modelo R1 é uma IA com raciocínio. Ele rivaliza diretamente com o o1 do ChatGPT, que era considerado o melhor modelo disponível até a DeepSeek aparecer com o R1. Essa conquista gerou tremores na indústria da IA.

O R1, além de ser excelente, custou cerca de 5% do valor gasto no treinamento do o3 da OpenAI e foi liberado como código aberto, atraindo a simpatia imediata da comunidade de desenvolvedores. O sucesso do R1 coloca a China numa posição de topo no mundo da tecnologia, cria problemas para as Big Techs americanas e também ameaça o império da Nvidia, a gigante de chips. E, vale lembrar, a DeepSeek está longe de ser a única organização chinesa a brilhar em IA. Outras empresas, como a Alibaba Cloud, têm surpreendido cada vez mais.

Modelo de IA gigante e com desempenho melhor

A nova versão do R1 possui impressionantes 685 bilhões de parâmetros, colocando-o no mesmo patamar de modelos líderes, como o o3 da OpenAI e o Gemini 2.5 Pro do Google. A DeepSeek afirma que a precisão do modelo aumentou de 70% para 87.5%. Eles também afirmam que o novo R1 reduziu significativamente o risco de alucinações.

Desempenho comparativo do novo DeepSeek R1 (fonte).

Embora esse update seja excitante, o tamanho do modelo, obviamente, impede que ele seja executado em um computador comum. Um computador comum suporta modelos de poucos Bs – preferencialmente abaixo de 5, mas isso varia de acordo com seu hardware. Segundo análises técnicas, o modelo R1 completo requer cerca de 16 GPUs de 80GB para rodar localmente.

Novo R1 destilado com Qwen: forte em código e matemática

Se o tamanho do modelo fez você perder o interesse, não desanime ainda. Além da atualização principal do R1, a DeepSeek também está liberando um modelo destilado: Deepseek-R1-0528-Qwen3-8B. A novidade é baseada na Qwen3 8B da Alibaba. Ele foi treinado com cadeias de pensamento do R1-0528 para obter um alto desempenho.

O que é notável nesse modelo destilado é sua capacidade de superar os modelos de topo em várias avaliações de benchmark, incluindo matemática, programação e lógica geral. A DeepSeek afirma que esse modelo compacto atinge 86% no AIME 2024. Esse desempenho surpreendente fica dez pontos acima do original Qwen3 8B. O novo destilado rivaliza com o desempenho de modelos muito maiores, como o Qwen3-235B-thinking.

Além do ótimo desempenho, outra grande vantagem do Deepseek-R1-0528-Qwen3-8B é sua eficiência computacional. Ele foi projetado para rodar eficientemente na GPU Nvidia H100. Uma única GPU é suficiente para executá-lo.

Licença muito permissiva como sempre

Além de apresentarem excelentes desempenhos, os modelos da DeepSeek são campeões em acessibilidade. Os modelos, disponíveis na plataforma Hugging Face, foram liberados como “abertos”. Você pode baixá-los e usá-los sem problemas.

O Deepseek-R1-0528 é liberado sob a licença MIT, uma das licenças de código aberto mais permissivas disponíveis. Este é um dos seus pontos mais fortes e um grande contraste em comparação com as licenças mais restritivas anexadas a modelos como Llama 3 ou Gemma. A licença MIT permite que qualquer pessoa use, modifique e distribua o modelo — até mesmo para projetos comerciais — com quase nenhuma restrição.

Os modelos baseados em Qwen da DeepSeek são geralmente liberados sob a licença Qianwen. A licença exige preservação de notificações de direitos autorais e licença. No entanto, ela concede direitos explícitos de patentes e permite que os usuários redistribuam obras modificadas sob termos diferentes — até mesmo sem compartilhar o código-fonte. Mas, segundo as fontes que consultamos, a versão Deepseek-R1-0528-Qwen3-8B está sendo disponibilizada com licença MIT!

Conclusões

Em conclusão, o modelo R1 atualizado da DeepSeek representa mais um marco na área da IA. Seu melhoramento em desempenho, precisão e acessibilidade o tornam uma opção atraente para desenvolvedores e pesquisadores.

Para desenvolvedores que desejam explorar aplicações de IA localmente, sem depender de serviços na nuvem ou hardware caro, o DeepSeek-R1-0528-Qwen3-8B é um desenvolvimento importante. Sua facilidade de uso e capacidades de desempenho o fazem uma opção atraente para quem deseja experimentar ou implantar IA de raciocínio sem gastar muito.