DeepSeek-V3.2-Exp: um avanço em soberania através da IA
Após a suspeita de espionagem com chips NVIDIA, nova IA DeepSeek's V3.2-Exp já está totalmente otimizada para inferências com chips (GPUs) chineses.

Receba nossa newsletter

DeepSeek garante soberania chinesa apostando em chips domésticos

deepseek

Lembra que a China ficou furiosa com os boatos de que políticos americanos estavam solicitando à Nvidia que colocasse mecanismos de espionagem e kill switches nos chips direcionados para o país? 

Pois a ameaça deu frutos mais cedo do que todos esperavam. A tentativa de cerceamento do progresso da China em IA por parte dos americanos teve o efeito oposto.

Uma das novidades da nova IA lançada pela DeepSeek, DeepSeek-V3.2-Exp, é a sua otimização para o hardware Ascend da Huawei com o kit de ferramentas de software CANN (Compute Architecture for Neural Networks). Este marco inaugura uma mudança deliberada nas prioridades chinesas para o desenvolvimento de modelos de IA de ponta usando aceleradores (GPUs) domésticos, em vez de depender do ecossistema CUDA da Nvidia.

Como mencionamos anteriormente, o DeepSeek-V3.2-Exp foi projetado para reduzir os custos associados à inferência de contextos longos, mantendo a qualidade da saída. Ele é visto como uma etapa intermediária em direção à nossa arquitetura de próxima geração que a startup deve lançar no futuro. Para reduzir os custos de treinamento, o modelo apresenta um mecanismo de atenção esparsa que corta os requisitos de memória e computação, tornando-o mais eficiente para o processamento de sequências longas.

China unida na defesa de uma IA totalmente nacional

A resposta da comunidade de IA na China foi rápida e altamente entusiasmada. A equipe Ascend da Huawei e a comunidade vLLM-Ascend integraram rapidamente o DeepSeek-V3.2-Exp em seus fluxos de trabalho. Já a equipe do CANN publicou um protocolo para inferências, posicionando o novo modelo da DeepSeek para implantação imediata no hardware da Huawei. No entanto, o que é ainda mais impressionante é o esforço coordenado de outros fabricantes de chips chineses, incluindo Cambricon e Hygon, que lançaram atualizações para seus aceleradores vLLM-MLU e DCU, respectivamente, com compatibilidade para a IA DeepSeek-V3.2-Exp. A SGLang também confirmou suporte em vários backends, incluindo o Ascend. 

Essa abordagem sincronizada demonstra o crescente compromisso da China com a soberania da IA. Ao desenvolver modelos otimizados para GPUs não CUDA no primeiro dia após o lançamento do novo modelo da DeepSeek, as empresas chinesas estão enviando uma mensagem clara de que não dependerão mais do ecossistema de hardware da Nvidia.

Conclusões

As implicações desses movimentos são de longo alcance. Com o DeepSeek-V3.2-Exp liderando o ataque, outras empresas de IA precisarão se adaptar às crescentes capacidades da China.

Conforme as empresas chinesas desenvolvem seus próprios aceleradores e softwares para GPUs, novos fluxos de receita e parcerias estão surgindo, abrindo caminhos para colaboração e investimento.

Para o Brasil, a expansão dos hardwares de IA com tecnologia chinesa pode significar acesso a materiais mais baratos e novas possibilidades de cooperação.

Pena que o exemplo da China ainda não inspira o Brasil a criar tecnologia de IA realmente nacional.

Imagem com IA Generativa – Dia 577

IA generativa - img577

Arte com IA generativa: imagem do dia

Todos os dias postamos um exemplo de imagem artística gerada com inteligência artificial.

Tutoriais

Postagens Mais Recentes

Outras Postagens Que Podem Interessar

Veja
Mais

Fique em contato

Se inscreva para receber nossa newsletter com novidades.

aprendiz artificial