OpenAI volta a ser open com dois modelos abertos!
Depois de DeepSeek, ERNIE 4.5, Qwen, Kimi K2, a pressão sobre a OpenAI para liberar um modelo aberto estava muito, muito grande. Afinal, a empresa foi criada para ser “open”, mas andava muito fechada e só pensava naquilo ($$$). Finalmente, a pressão surtiu efeito! Após uma longa espera que teve até adiamento, a OpenAI lançou seus primeiros modelos grandes de linguagem (LLMs) de peso aberto desde o GPT-2. Esse avanço marca a primeira vez desde 2019 que a OpenAI, que já havia sido apelidada de ClosedAI, disponibiliza sua tecnologia de IA de forma pública e não restrita.
Mas o que são modelos de peso abertos?
Em termos simples, um modelo aberto refere-se a uma rede neural cujos parâmetros (os pesos) estão disponíveis publicamente. Isso significa que os usuários podem acessar e modificar o código subjacente do modelo sem precisar ter acesso ao código completo ou a licenças de software proprietário.
A colaboração da OpenAI com as principais empresas de tecnologia, como a Nvidia, garante que esses modelos funcionarão de forma semelhante em diversas plataformas de hardware, incluindo laptops, infraestrutura em nuvem e chips especializados de IA. A empresa também realizou testes e avaliações extensivas de segurança para assegurar que seus novos modelos não sejam utilizados com intenções maliciosas.
Entenda a importância dos modelos abertos
Em essência, os modelos de peso aberto oferecem uma alternativa mais barata em comparação aos produtos tradicionais de empresas como a OpenAI. Além disso, eles facilitam para os usuários a execução e personalização de seus próprios modelos de linguagem. Isso é significativo, pois permite maior transparência e controle no desenvolvimento da IA, características essenciais para construir confiança na tecnologia.
Geopolítica explica movimento
A mudança de postura da OpenAI não é simplesmente um aceno à comunidade de desenvolvedores. Ela faz parte de um reposicionamento dos Estados Unidos na busca pela liderança em IA.
Uma grande consequência da liberação de modelos abertos é o ambiente de desenvolvimento acelerado que eles promovem. Com desenvolvedores tendo acesso às novas tecnologias e podendo entendê-las, o surgimento de novidades é catalisado. Não é à toa que a China, atual recordista na liberação de modelos abertos, é o maior centro de inovação de IA. Enquanto isso, os Estados Unidos, com sua cultura que privilegia o lucro de poucos em detrimento do avanço coletivo, têm visto os salários dos engenheiros envolvidos na criação dos LLMs famosos de empresas como Google e OpenAI dispararem.
A cultura de modelos fechados torna a competição entre empresas acirradas e, na luta pelo poder, vale tudo para roubar os profissionais dos concorrentes. Até a administração Trump já se tocou dos riscos do domínio dos modelos fechados e tem explicitamente defendido a liberação de mais modelos abertos.
gpt-oss: capacidade agêntica e altamente personalizáveis
Como o nome indica, os modelos abertos gpt-oss possuem aproximadamente 120 e 20 bilhões de parâmetros. O gpt-oss-120b é mais apropriado para casos de uso de produção, uso geral e alto raciocínio que se encaixam em uma única GPU H100 (ele possui 117B parâmetros e 5,1B parâmetros ativos). Já o gpt-oss-20b foi desenhado para casos de uso locais ou usos especializados (21B parâmetros e 3,6B parâmetros ativos).
Segundo a descrição oficial, o gpt-oss-20b pode rodar localmente na maioria dos computadores que temos em casa. Mas atenção: modelos acima de 5B podem ser grandes demais para tarefas locais dependendo do computador que você possui. Portanto, se você deseja executar as novidades, garanta que seu hardware é adequado.
Ambos os modelos são otimizados para uso agêntico, com destaque para o uso de ferramentas dentro da cadeia de pensamento, incluindo pesquisas na web e execução de códigos Python.
Outra vantagem das novidades é que eles são profundamente personalizáveis. Eles suportam ajuste do esforço de raciocínio para baixo, médio ou alto. Além disso, eles podem ser personalizados para se adaptarem ao seu caso de uso com ajuste fino completo de parâmetros.
Toda a cadeia de pensamento dos modelos pode ser acessada para facilitar a depuração e aumentar a confiança em suas saídas.
licença Apache 2.0
Ambos os modelos da serie gpt-oss foram liberados como licença Apache 2.0. Isso significa que você pode usá-los livremente sem se preocupar com restrições de copyleft ou risco de patente, independentemente de você estar experimentando, personalizando ou implantando comercialmente as novidades. A escolha da licença Apache 2.0 é louvável, especialmente em comparação com os termos de licenciamento mais restritivos da Meta para seus modelos Llama e do Google para os modelos Gemma.
Onde encontrar
Os novos modelos estão disponíveis na plataforma Hugging Face. Eles também podem ser baixados diretamente do GitHub.