Conectar a IA aos seus números (sem vazar nada)
Como fazer a IA trabalhar com os seus números de verdade, escolhendo o caminho certo pelo formato do dado e conectando com segurança, sem vazar informação nem inventar valor.
Você pergunta para a IA qual foi a sua margem de contribuição no último trimestre. Ela responde com uma análise impecável, cheia de termo bonito de finanças. E inventada. A IA nunca abriu o seu ERP nem o seu fechamento, então ela chuta um número plausível.
Putz, repara numa coisa: o problema quase nunca é a IA ser ruim de conta. O problema é que ela está respondendo de cabeça, sem nunca ter aberto os SEUS números. É como contratar o melhor analista financeiro do mercado, sentar ele na sua sala e nunca dar acesso ao seu ERP, ao seu fechamento, à sua planilha de custos. Ele vai falar bonito e vai errar feio, porque está adivinhando. Conectar a IA aos seus dados é exatamente o que tira ela do genérico. Só que conectar errado é pior: ou vaza informação que não podia sair, ou inventa um número com cara de verdade.
A ideia central desta aula. A IA só serve de verdade quando trabalha COM os seus números, e o FORMATO do dado decide o caminho. Dado estruturado (planilha, ERP, tabela) muitas vezes nem pede busca vetorial: a IA raciocina sobre o schema, as estatísticas e uma amostra. Documento de texto (política, contrato) pede RAG, busca por significado. Relatório com gráfico e tabela (PDF de fechamento, demonstrativo) quebra o RAG tradicional, e aí entra ler a página como imagem, sem perder os números. E em finanças, antes de qualquer coisa, vem a pergunta de segurança: o que pode sair da empresa e o que não pode.
01O formato do dado decide o caminho
A primeira coisa que muda tudo é parar de tratar "os meus dados" como uma coisa só. Não existe um caminho único para conectar a IA aos seus números. O que existe é o formato do dado, e o formato dita a estrada.
Pensa comigo em três tipos de número que vivem em toda empresa. Tem o dado estruturado, que mora em linha e coluna: a planilha de custos, a tabela do ERP, o relatório de vendas exportado. Tem o documento de texto corrido: a política de crédito, o contrato do fornecedor, o manual de aprovação de despesa. E tem o relatório visual: o PDF do fechamento mensal, o demonstrativo com gráfico, a apresentação de resultado com tabela colorida.
São três naturezas diferentes, e cada uma pede uma ferramenta diferente. Tentar enfiar os três no mesmo caminho é o erro número um. O estudo do @datasciencebrain bate exatamente nessa tecla: o formato do dado decide a arquitetura de memória, não o contrário.
02Dado estruturado: muitas vezes a IA nem precisa de vetorial
Aqui mora o engano mais comum de quem acabou de aprender RAG: achar que TODO dado precisa virar busca vetorial. Não precisa. E em finanças isso é especialmente verdade, porque boa parte dos seus números vive estruturado, em linha e coluna.
Quando o dado é uma planilha de custos ou uma tabela do ERP, a IA não ganha quase nada transformando cada célula em coordenada de significado. O que ela precisa é entender a ESTRUTURA: quais são as colunas, o que cada uma significa, qual é o total de linhas, a soma de cada coluna, o intervalo dos valores. Em vez de "buscar trechos parecidos", ela raciocina sobre o schema, sobre as estatísticas (média, soma, máximo, mínimo) e sobre uma amostra de algumas linhas representativas.
Pensa na diferença prática. Para responder "qual produto tem o pior custo unitário", a IA não precisa de uma busca semântica difusa. Ela precisa olhar a tabela, ordenar a coluna de custo unitário e ler a primeira linha. Isso é raciocínio sobre dado estruturado, não busca vetorial. É mais barato em token, mais exato e não tem o risco de a busca trazer a ficha errada.
O recado é direto: antes de montar um RAG inteiro para os seus números, pergunte se o dado já não está estruturado. Se está, o caminho é dar para a IA o schema, as estatísticas e uma amostra, e deixar ela calcular. Beleza?
03Documento e relatório visual: dois caminhos que não se misturam
Agora os dois outros formatos, que muita gente trata igual e não são.
O documento de texto é o território natural do RAG, exatamente como você viu na aula de RAG e memória (a 2.4). A política de crédito, o contrato do fornecedor, o manual de despesas: tudo isso é texto corrido, e a IA acha a resposta certa buscando por significado. Você pergunta "qual o prazo de pagamento desse contrato" e a busca por significado puxa o trecho certo, mesmo que o contrato escreva "vencimento" em vez de "prazo de pagamento". Para texto, RAG resolve.
O relatório visual é onde mora a armadilha. Pega o PDF do seu fechamento mensal: ele tem tabela, tem gráfico de barras, tem número alinhado em coluna, tem rodapé com a nota de rodapé que muda o sentido da linha de cima. Se você joga esse PDF num RAG tradicional, ele extrai o texto e EMBARALHA tudo: a tabela vira uma sopa de números soltos, o gráfico desaparece, a relação entre a linha e a coluna se perde. O RAG tradicional quebra no relatório visual, e o pior é que ele quebra em silêncio: devolve um número que parece certo e está errado.
A saída é ler a página como IMAGEM. Modelos com visão (multimodal) olham o PDF como uma foto da página, enxergam a tabela como tabela, o gráfico como gráfico, e preservam a relação entre os números. É a diferença entre transcrever um demonstrativo às cegas e olhar para ele de fato.
04Segurança: em finanças, é o ponto mortal
Tudo que vimos até aqui é sobre fazer a IA acertar. Agora o ponto que, no financeiro, é o que pode te derrubar: o que sai da empresa.
No instante em que você conecta a IA aos seus números, você precisa responder uma pergunta antes de qualquer outra: esse dado PODE sair da empresa? Tem dado que pode ir para um modelo na nuvem sem problema nenhum. E tem dado que não pode sair de jeito nenhum: folha de pagamento nominal, dado de cliente, número que move o preço da sua ação, base que cai sob LGPD. Mandar isso para fora sem pensar não é otimização, é vazamento.
Existem três camadas de proteção que andam juntas. A primeira é anonimização: tirar o que identifica antes de mandar, trocar o nome do cliente por um código, mascarar o CPF, agregar o que dá para agregar. A segunda é a escolha de onde rodar: dado sensível pode pedir um modelo rodando local ou num ambiente fechado, em vez da nuvem pública, e isso é uma decisão de risco, não de preguiça. A terceira é o gateway, um portão que fica entre você e o modelo e BARRA o que não pode passar, registrando tudo que passou.
Esse gateway é o mesmo conceito da Pilha mais AI Gateway que você viu na Sala de Máquinas, e conecta direto com a aula de governança da execução (a 4.4). Não é burocracia: é o que separa "usei IA nos meus números" de "vazei os meus números para um terceiro sem perceber". Em finanças, essa diferença tem nome de processo, de multa e de demissão.
05Juntando tudo: do número genérico ao número seu
Agora dá para ver o quadro inteiro. Conectar a IA aos seus dados é o que tira ela do genérico, é o que faz ela parar de chutar e começar a responder com o seu fechamento na frente. Mas conectar é uma faca de dois gumes: conectar errado ou vaza informação que não podia sair, ou inventa um número com cara de verdade.
A sequência mental que protege você é sempre a mesma. Primeiro, olhe o FORMATO do dado e escolha o caminho: estruturado vira raciocínio sobre schema, texto vira RAG, relatório visual vira leitura como imagem. Segundo, antes de plugar qualquer coisa, passe pela checagem de segurança: esse dado pode sair, precisa anonimizar, roda local ou na nuvem, o gateway está no meio. Formato primeiro, segurança sempre.
Quem entende essa ordem para de tratar IA como uma caixa mágica que adivinha número e passa a tratar como um analista que você dá acesso, com regra, ao que ele pode ver. É a diferença entre uma análise que você confia e uma que te coloca numa reunião com um número fantasma. Beleza?
Faça agora
Pegue um caso real do seu financeiro onde a IA respondeu de cabeça e errou, ou onde você ainda nem tentou usar IA: a sua tarefa real.
- Liste 3 fontes de número que conteriam a resposta certa (ERP, planilha de custos, PDF de fechamento, contrato, extrato).
- Para cada fonte, classifique o FORMATO: estruturado (linha e coluna), documento de texto, ou relatório visual (tabela e gráfico numa página).
- Marque o caminho de cada uma: estruturado leva a raciocínio sobre schema, texto leva a RAG, relatório visual leva a leitura como imagem.
- Faça a checagem de segurança de cada fonte em uma linha: esse dado pode sair da empresa? Precisa anonimizar? Roda na nuvem ou pede ambiente fechado?
- Aponte qual fonte é a mais sensível das três e escreva, em uma frase, o que o gateway deveria barrar nela.
Você acabou de desenhar a conexão dos seus números com a IA pelo caminho certo e com o portão de segurança no lugar. Está à frente de quem só joga o PDF do fechamento num chat e reza.
Pratique
1. Você precisa que a IA responda 'qual produto tem o pior custo unitário' a partir da sua planilha de custos. Qual é o caminho mais indicado?
2. Por que jogar o PDF do fechamento mensal (com tabelas e gráficos) num RAG tradicional costuma dar resposta errada?
3. Antes de conectar a IA a um dado financeiro sensível (folha nominal, base de clientes), qual é a postura correta?
Valeu pelo feedback. Isso ajuda a afiar a próxima aula.