DeepSeek libera nova IA
Após ter causado muito rebuliço no mundo da inteligência artificial (IA) no início do ano, a startup DeepSeek andava meio sumida. Mas agora ela volta à cena e com uma ótima novidade. Ela acaba de lançar uma adição significativa para sua família de modelos grandes de linguagem (LLM): DeepSeek-V3.1-Terminus.
DeepSeek-V3.1-Terminus: melhor desempenho e mais versatilidade
A nova IA DeepSeek-V3.1-Terminus foi desenvolvida com base na família de modelos DeepSeek V3 lançada no ano passado. A mais recente atualização supera as limitações de seu antecessor, o DeepSeek V3.1, introduzindo vários refinamentos. Eles foram projetados para melhorar principalmente a consistência da linguagem e a eficácia de suas ferramentas agênticas.
O Terminus busca oferecer uma experiência mais estável, confiável e consistente. O nome Terminus indica que este lançamento é a versão definitiva e final da série de modelos V3 até que uma nova arquitetura, V4, possa chegar. A IA tem um total de 671 bilhões de parâmetros (com 37 bilhões ativos a qualquer momento) e consiste em um modelo híbrido poderoso e eficiente de Mistura de Especialistas (MoE).
A versão Terminus apresenta melhorias notáveis no desempenho. As melhoras se destacam particularmente em tarefas de uso de ferramentas agênticas. De acordo com os resultados dos benchmarks, a nova IA supera seu antecessor em vários domínios. Ela se saiu melhor no SimpleQA, BrowseComp, SWE Verified, SWE-bench Multilingual e Terminal-bench.
Dois modos operacionais
O DeepSeek-V3.1-Terminus possui modos operacionais distintos:
deepseek-chat (modo sem pensamento): ideal para alimentar aplicativos de uso geral, este modo fornece chamadas de função, conclusão do tipo FIM (Fill-in-the-Middle) e saída JSON.
deepseek-reasoner (modo com pensamento): versão com raciocínio contextual profundo. Ela não possui chamadas de função e FIM.
Além de saída JSON, ambos os modos possuem uma janela de contexto de 128.000 tokens.
Disponibilidade
O DeepSeek-V3.1-Terminus está disponível para download na plataforma Hugging Face. Ele foi liberado com licença MIT e pode ser modificado e personalizado para atender às suas necessidades.
Os dois modos do DeepSeek-V3.1-Terminus também podem ser usados em aplicativos através de chamadas de API. O preço para ambos os modos é baseado no número de tokens usados.
Conclusões
DeepSeek-V3.1-Terminus é mais uma novidade importante da área de IA. E, novamente, a empresa combina desempenho de peso com acessibilidade através de seu baixo custo de uso. O novo DeepSeek-V3.1-Terminus também demonstra mais uma vez o compromisso da startup DeepSeek com a abordagem de código aberto. Em breve, poderemos testemunhar o surgimento de novos modelos, como o DeepSeek V4, que já despertou interesse entre os entusiastas da área.