Kimi K2: a primeira IA aberta com 1 trilhão de parâmetros

Posts Relacionados:

OpenAI Academy: a plataforma de aprendizagem da OpenAI

Chatbot Arena e as trapaças na comunidade de IA

Elon Musk disponibiliza versão de código aberto de Grok

18.07.25

Desempenho impressionante, processo de treinamento eficiente, preços acessíveis e de código aberto? Conheça Kimi K2, uma IA com 1 trilhão de parâmetros.

Receba nossa newsletter

Kimi K2: a super IA que estreia com 1 trilhão de parâmetros

E o mundo da IA foi surpreendido de novo com um modelo que está quebrando as expectativas e redefinindo as regras do jogo. Neste post, apresentaremos a nova IA Kimi K2, um modelo revolucionário de código aberto desenvolvido pela startup chinesa Moonshot, apoiada pelo Alibaba. A novidade recém-lançada deixou a comunidade de IA atordoada com seus recursos, desempenho, tamanho e preços.

Segundo as fofocas, Kimi K2 é a razão por trás do novo adiamento do modelo de código aberto da OpenAI, que já andava reclamando de outra empresa chinesa, a Zhipu. Com seu desempenho impressionante, processo de treinamento eficiente e preços acessíveis, o modelo Kimi K2 está pronto para desafiar o domínio das gigantes de IA.

Então, o que torna o Kimi K2 tão especial?

O Kimi K2 é um modelo grande de linguagem (LLM) de peso aberto que possui surpreendentes um trilhão de parâmetros.

A arquitetura do Kimi K2 é baseada em uma abordagem de mistura de especialistas (MoE). Ela permite que o modelo processe tarefas complexas, roteando cada tarefa para um pequeno grupo de especialistas. Essa configuração acelera a passagem inicial sobre o texto enquanto recupera a profundidade por meio da ativação seletiva de especialistas. O resultado é um modelo que pode oferecer desempenho de primeira linha por uma fração do custo de computação. Esse design não apenas permite economias computacionais significativas, mas também garante que os pesquisadores possam compartilhar pontos de verificação.

Para o treinamento do Kimi K2, o otimizador MuonClip do Moonshot AI desempenhou um papel crucial. O MuonClip apresenta duas inovações significativas para melhorar a estabilidade e a eficiência do treinamento:

Visão de segunda ordem: esse recurso permite que o modelo faça atualizações mais nítidas e estáveis durante o treinamento, melhorando a velocidade e a confiabilidade.

QK-clipping: mecanismo de segurança que limita as atualizações antes que elas saiam do controle, mantendo o modelo focado e estável.

Esse treinamento, segundo algumas fontes, deve ter resultado em uma enorme economia de computação. Dados do início do ano estimaram que os otimizadores Muon são aproximadamente duas vezes mais eficientes computacionalmente do que o AdamW, usado tradicionalmente no treinamento de LLMs.
O treinamento do Kimi K2 foi feito em mais de 15,5 trilhões de tokens, aproximadamente 50x a entrada do GPT-3 da OpenAI, sem um único pico de perda, falha catastrófica ou reinicialização. Isso significa que o treinamento do novo Kimi K2, assim como o DeepSeek, foi relativamente barato. Provavelmente custou dezenas de milhões de dólares.

Dois Modelos

A novidade vem em duas versões:

Kimi-K2-Base: o modelo de base, ideal para pesquisadores e construtores que desejam controle total para ajuste fino e soluções personalizadas.

Kimi-K2-Instruct: modelo pós-treinado adequado para chats de uso geral e experiências agênticas.

Nenhum dos modelos tem raciocínio ainda. Mas a Moonshot já se prepara para lançar uma versão atualizada com raciocínio de cadeia de pensamento.

Desempenho

Nos testes iniciais, o Kimi K2 demonstrou um desempenho impressionante em códigos e benchmarks matemáticos. No SWE-Bench Verified, o Kimi K2 supera os principais modelos proprietários, alcançando uma pontuação surpreendente de 65,8% em um subconjunto validado por humanos do benchmark de engenharia de software. Isso significa que o Kimi K2 pode reparar automaticamente quase dois terços das tarefas reais de correção de bugs do GitHub, gerando trechos que passam em todos os testes de unidade.

Código aberto

Como toda boa novidade em IA, o Kimi K2 vem com código aberto (peso aberto). O lançamento do Kimi K2 com sua arquitetura gigante marca um ponto de virada significativo nos modelos de peso aberto. Ele abre caminho para infraestrutura científica compartilhada e colaboração em uma escala sem precedentes.

Onde encontrar

Para quem quer usar o novo modelo, ele pode ser encontrado no GitHub, no site da empresa para consultas online, na plataforma da MoonShot para chamadas de API e também deve ser disponibilizado na plataforma Hugging Face.

Precinho camarada

No quesito preço, o Kimi K2 também arrasa. O preço pré-pago do Kimi K2 é de cerca de US$ 0,15 por milhão de tokens de entrada e US$ 2,50 por milhão de tokens de saída. Ou seja, bem abaixo da maioria dos modelos de fronteira. O Kimi K2 é 30% mais barato que o Gemini 2.5 Flash e bem mais barato do que os modelos da OpenAI e Anthropic. O GPT-4.1 da OpenAI, por exemplo, lista US$ 2,00 por milhão de tokens de entrada e US$ 8,00 para saída, enquanto o Claude Opus 4 da Anthropic chega a US$ 15 e US$ 75.

Conclusões

O surgimento do Kimi K2 marca uma mudança significativa no cenário da IA. O novo modelo confirma que a China está liderando o ataque em inovações de eficiência de IA, desafiando o domínio ocidental. Seu lançamento sob licença permissiva deve desencadear mais uma onda de inovação de código aberto, acelerando o progresso e reduzindo custos.