Browser Use e agentes de IA
Está se tornando cada vez mais evidente que a próxima fronteira da inteligência artificial (IA) em automação será centrada em interações na web. E ela deve envolver agentes de IA. Browser Use, uma novíssima startup da ETH Zurich, deu passos significativos nessa área ao desenvolver uma ferramenta inovadora que torna os sites mais legíveis para agentes de IA. E por que essa notícia deve te interessar? A solução encontrada pelos dois criadores da startup é simples, mas já conseguiu arrematar 17 milhões de dólares em investimentos e tem chamado muito a atenção da comunidade de IA. Parte do interesse veio do fato da ferramenta ter sido adotada pelo poderosíssimo Manus.
Facilitando o acesso de agentes de IA à internet
Agentes de IA são sistemas que podem concluir tarefas de forma autônoma. Muitas das tarefas que eles realizam ocorrem na internet. Porém, se você conhece um pouco de web scrape, sabe que a internet é a maior fonte mundial de informações não estruturadas e, para complicar, está em constante atualização. Neste cenário, mover o cursor do mouse, clicar em botões e preencher formulários se tornam tarefas desafiadoras. Ou seja, as características da internet dificultam a vida dos agentes de IA que precisam navegar na web.
A solução da ferramenta Browser Use aborda esse problema com uma proposta simples. Ela combina web scrape com ciências de dados para converter cada site em texto estruturado que os grandes modelos de linguagem (LLMs) podem processar de forma determinística.
Na prática, a ferramenta permite criar agentes que interagem com elementos da web usando prompts de linguagem natural. O Browser Use é, em essência, uma camada que simplifica a interação do site para LLMs extraindo xPaths e elementos interativos como botões e inputs de formulários. Isso permite a criação de funções personalizadas de automação e scraping da web sem inspeção manual por meio do DevTools.
Com essa solução simples, os agentes de IA conseguem entender as diferentes opções disponíveis em cada página da web facilmente. A startup diz que o resultado é que os agentes de IA podem navegar pela web muito mais rápido, interagindo com diferentes elementos da interface do usuário com mais precisão.
Se você se interessou pela novidade, ela está totalmente disponível no GitHub.
Startup começou como um projeto de fim de semana
Mas o legal dessa história é que ela serve de inspiração. A ferramenta Browser Use é o fruto de uma startup que basicamente surgiu do nada. Ela começou como um experimento de fim de semana. Seus dois fundadores, Magnus Müller e Gregor Zunic, projetaram e construíram um protótipo da ferramenta Browser Use em apenas cinco dias. Ele foi lançado publicamente por meio de um simples post no site Hacker News. Veja o post na imagem abaixo (clique para acessar o link aqui):
A novidade rapidamente recebeu uma resposta entusiasmada da comunidade de desenvolvedores de agentes de IA. Evidentemente, os dois fundadores criaram uma empresa (ETH Zurich) e agora colhem seus frutos. Em poucos meses, já faturaram alguns milhões.