Biblioteca · Paper · 2023 · NeurIPS

Toolformer: Language Models Can Teach Themselves to Use Tools

Schick, T., Dwivedi-Yu, J., Dessì, R., Raileanu, R., Lomeli, M., Zettlemoyer, L., Cancedda, N., Scialom, T.

Primeiro paper a mostrar de forma sistemática como LLMs podem aprender a CHAMAR ferramentas externas (calculadora, busca, APIs). Base conceitual de toda a era 'agentes' e 'function calling'.

A leitura do Thiago

Toolformer é o paper que tirou os LLMs do papel de 'ChatGPT que só conversa' e os transformou em AGENTES capazes de USAR ferramentas. A ideia: ensinar o modelo a, durante a geração de uma resposta, decidir sozinho 'aqui preciso de uma calculadora', 'aqui preciso buscar na web', 'aqui preciso consultar um banco de dados', e fazer essas chamadas como um humano faria. A descoberta crítica: o próprio LLM pode GERAR seus dados de treinamento, simulando quando ferramentas seriam úteis.

Em linguagem executiva: foi a fundação conceitual para 'function calling' (OpenAI, 2023), 'tool use' (Anthropic), MCP e toda a explosão atual de agentes autônomos. Para corporações brasileiras, três aplicações imediatas: (1) agentes que se conectam aos seus sistemas internos (ERP, CRM, dashboards de BI) para responder perguntas de negócio em linguagem natural, está sendo implementado em escala em bancos e varejistas; (2) automação de processos de back-office (tickets de suporte, conciliação financeira, validação de contratos) onde o agente segue uma 'jornada' com decisões; (3) lição arquitetural crucial: o futuro da IA corporativa não é 'um modelo gigante que sabe tudo', mas 'um modelo competente que sabe quais ferramentas chamar', isso muda como você desenha sua arquitetura de dados e APIs internas.

O que muda na prática

Toolformer é o paper que muda a pergunta que você faz sobre IA na sua empresa. Saiu de 'que modelo é o mais inteligente?' para 'a quais sistemas meus o modelo consegue se conectar?'. A descoberta central é que o LLM pode decidir sozinho, no meio de uma tarefa, que precisa de uma calculadora, de uma busca, de uma consulta ao banco de dados, e fazer essa chamada.

Isso transforma o chatbot que só conversa num agente que executa. Para quem decide, a implicação é direta: o gargalo da IA útil na sua operação deixou de ser o modelo (já são bons o bastante) e passou a ser o estado das suas APIs e da sua documentação interna. Se seu ERP, CRM e BI não têm interfaces limpas e descritas, o agente mais avançado do mundo não consegue trabalhar com eles.

Na prática, isso vira prioridade de investimento. Antes de comprar 'o agente de IA' de um fornecedor, pergunte e olhe para dentro: meus sistemas expõem o que esse agente precisaria consultar? A automação de back-office que esse paper viabiliza (triagem de tickets de suporte, conciliação financeira, validação de contratos, resposta a perguntas de negócio direto sobre o dashboard) só funciona quando o agente tem ferramentas confiáveis para chamar.

O retorno do projeto de IA frequentemente depende menos do modelo e mais do trabalho menos glamouroso de organizar e expor seus dados e processos internos. A lição arquitetural maior, e a que mais erra quem está começando, é parar de procurar 'um modelo gigante que sabe tudo'. O desenho que vence é um modelo competente que sabe quais ferramentas chamar e quando.

Para quem opera, isso significa que confiabilidade e rastreabilidade passam a importar tanto quanto inteligência: cada ação que o agente toma (consultou tal sistema, alterou tal registro) precisa ficar registrada e auditável, porque agora a IA não só fala, ela age sobre seus sistemas. Desenhar esse log de ações desde o início é o que separa um piloto bonito de uma automação que você confia em produção.

O abstract original (inglês)
Language models exhibit remarkable abilities to solve new tasks from just a few examples. We show that LMs can teach themselves to use external tools via simple APIs and achieve the best of both worlds. We introduce Toolformer, a model trained to decide which APIs to call, when to call them, what arguments to pass, and how to best incorporate the results into future token prediction.
llmagentstool-usemeta
Ler o paper original →
O que você achou desta página?
Recomendaria esta página para alguém do seu time?